只为小站
首页
域名查询
文件下载
登录
李升波-强化学习与控制-第七讲
本课程为强化学习与控制,由清华大学开设,长聘教授李升波主讲,共十一讲,本讲为第七讲,主要介绍直接型RL的
策略梯度法
,包括各类Policy Gradient, 以及如何从优化的观点看待RL等。
2021-07-09 16:08:09
2.17MB
强化学习
最优控制
李升波教授
策略梯度法
1
个人信息
点我去登录
购买积分
下载历史
恢复订单
热门下载
MAC OS.X.10.8.iso 镜像文件
mingw-w64-install.exe
倒立摆的模糊控制(基于simulink仿真,适合初学者).rar
20200318附加-2019年电赛综合测评方案详细计算过程(pdf版本,有朋友反映word版本乱码,特意转为pdf)
拾荒者扫描器.zip
quartus II13.0器件库.zip
2019综合测评仿真.zip
基于傅里叶算子的手势识别的完整源代码(Python实现,包含样本库)
token登录器.rar
华为结构与材料工程师-知识点总结【by詹姆斯申易登】.pdf
基于S函数的BP神经网络PID控制器及Simulink仿真和对应代码模型.zip
航迹融合算法MATLAB仿真程序
数字图像处理[冈萨雷斯]
基于yolov4-keras的抽烟检测(源码+数据集)
android开发期末大作业.zip
最新下载
DirectShow访问USB摄像头Demo
fast-lio2代码
最优化算法/工程优化 陈开周版课后习题1到4章答案
伽卡他电子教室杀手
应用非线性控制(完整版 程代展中文译本).pdf
DevXUnityUnpacker--unity解包反编译工具--unity开发比较强悍的工具
教育培训挂机辅助 中国检察教育培训网络学院学习辅助 v1014
Creating Solid APIs with Lua
现代数字信号处理及其应用习题解答(何子述)
RSA加密解密签名(密钥任意长度)
其他资源
概率导论(MIT)的课后习题答案
JAVA开发实战经典-课后习题答案-李兴华.pdf
fpga入门详细示例,基于Altera DE2-115 开发板
信号与系统_陈后金_课后答案 完整影印版
Python-使用Python和keras进行股票预测
FPGA(ep2c8q208c8n)引脚中文详解
gps 程序 包括信号生成 和捕获
JSP MYSQL旅游信息网站 源代码
电子科技大学矩阵理论往年试题+课件.zip
口语交际:名字里的故事.docx
PD ISO/IEC PAS 16898:2012 电动车二次锂离子电池的尺寸和名称 - 完整英文版(19页)
BT301 full documents.zip
PommelBot:鞍马机器人-源码
AE+PR插件DigitalAnarchy.bundle.2018.CE.zip
springboot教程项目代码
郑蔚——Weex移动应用架构设计和实战
NFC Card万能读卡android程序,可读公交卡,银行卡
pb 截图 抓屏 capture screen powerbuild9