只为小站
首页
域名查询
文件下载
登录
李升波-强化学习与控制-第七讲
本课程为强化学习与控制,由清华大学开设,长聘教授李升波主讲,共十一讲,本讲为第七讲,主要介绍直接型RL的
策略梯度法
,包括各类Policy Gradient, 以及如何从优化的观点看待RL等。
2021-07-09 16:08:09
2.17MB
强化学习
最优控制
李升波教授
策略梯度法
1
个人信息
点我去登录
购买积分
下载历史
恢复订单
热门下载
中国地面气候资料日值数据集(V3.0)-201001201912.rar
【SystemVerilog】路科验证V2学习笔记(全600页).pdf
EEupdate_5.35.12.0 win10下修改intel网卡mac
锁相环simulink建模仿真.rar
PSO-LSSVM的MATLAB代码.rar
2010年-2020中国地面气候资料数据集(V3.0)
Monet智能交通场景应用
全国道路网SHP数据.zip
拾荒者扫描器.zip
android开发期末大作业.zip
matpower5.0b1.zip
非线性本构关系在ABAQUS中的实现.pdf
多目标微粒子群算法MOPSO MATLAB代码
基于OpenCV的车牌号码识别的Python代码(可直接运行)
基于Matlab的PI/4 DQPSK的调制解调源代吗
最新下载
基于Android无障碍服务实现的自动连点器
PcanView(汉化版)
FreeNAS-9.2.1.7-RELEASE-x64.iso
Differential Privacy From Theory to Practice.pdf
师学宝视频自动学习软件
kzllyy template20181214.zip
UT音效包完整版.7z
QYT8900车台说明书
Pointers On C
极域课堂管理系统软件v6.0-2.7.17466 2023专业版
其他资源
200个SCI收录杂志的写作模板(ACS,Nature,JACS等) Templates.rar
案例数据-移动端APP安装情况与贷款违约行为预测
余孟尝] 数字电子技术基础简明教程.pdf
迁移学习理论与应用_杨强
kd-树matlab程序
企业考勤管理系统的设计与实现--开题报告
fashion-mnist数据集
matlab一元线性回归例子
《计算机系统要素》配套资源1
六子棋棋型研究c++源代码,很好的总结哦
《C语言程序设计教程》习题解答(含答案).pdf
Acme CAD Converter 2014 v8.6.2.1416.rar
基于jsp的新闻网程序
简单的rc5对文件加解密算法
比特币bitcoin源代码
酒店客房管理系统JSP
findjmp.exe
stm32系列sim900a发送短信代码
模式分类 duda(第二版)课后习题答案
PHP的adodb类库
最新汽车信息数据库
WordPress免费响应式企业主题onepress破解版