只为小站
首页
域名查询
文件下载
登录
李升波-强化学习与控制-第七讲
本课程为强化学习与控制,由清华大学开设,长聘教授李升波主讲,共十一讲,本讲为第七讲,主要介绍直接型RL的
策略梯度法
,包括各类Policy Gradient, 以及如何从优化的观点看待RL等。
2021-07-09 16:08:09
2.17MB
强化学习
最优控制
李升波教授
策略梯度法
1
个人信息
点我去登录
购买积分
下载历史
恢复订单
热门下载
IEEE 39节点系统的Simulink模型
Microsoft Visual C++ 2015-2019 运行库合集,包含32位64位
狂神说全部笔记内容.zip
拾荒者扫描器.zip
基于LSTM模型的股票预测模型_python
科研伦理与学术规范 期末考试2 (40题).pdf
2019西门子杯六部十层电梯群控参考程序.zip
中国地面气候资料日值数据集(V3.0)-201001201912.rar
基于YOLOV5的车牌定位和识别源码.zip
《MIMO-OFDM无线通信技术及MATLAB实现》高清PDF及源代码
【SystemVerilog】路科验证V2学习笔记(全600页).pdf
基于Servlet+jsp+mysql开发javaWeb学生成绩管理系统
pytorch实现RNN实验.rar
神经·模糊·预测控制及其MATLAB实现PDF + MATLAB程序
2019综合测评仿真.zip
最新下载
图像融合-评估指标-python
School Days HQ GPK文件解包工具
Powerbuilder6.5绿色版
Labview与基恩士LK-G5000激光测距仪TCP通讯
vox-adv-cpk.pth.tar
gcc-arm-none-eabi-9-2019-q4-major-win32.7z
历史上的今天数据库
AutoScriptWriter v2.0.zip
MT5双线MACD.zip
STM32cubeIDE 1.8.0
其他资源
石文软件测井地质专用软件
KPCA算法实现代码,MATLAB
C++打造流星雨特效源代码
stm32矩阵按键程序.rar
滴水三期完整版(96课时)
Matlab波特图Bode绘制
palo alto维护手册
java对音频文件的频谱分析
四旋翼飞行器的容错控制
ArpCheat,一个ARP欺骗工具,附源代码
SmartTCP-自动回复TCP消息工具
模糊相似矩阵Matlab程序
LED_Tutorial.zip
独立站工具汇总.xls
JDK1.8 API 中文 高清完整CHM版
CDT规约(电力系统设备通信协议之一)
Kiwi_Syslog_Server_9.6.7.Eval.setup
Android自定义播放器的改进版本
软件项目文档实例(召唤兽管理)
mega16资料
简易的smtp服务器与客户端的C代码
MATLAB中模糊控制的表格生成方法
基于VQ的特定人孤立词语音识别
THINKPHP5__下载可用
Interest Rate Markets - A Practical Approach to Fixed Income