只为小站
首页
域名查询
文件下载
登录
李升波-强化学习与控制-第十一讲
清华大学智能驾驶实验室官网:http://www.idlab-tsinghua.com/thulab/labweb/index.html 本课程为强化学习与控制,由清华大学开设,长聘教授李升波主讲,共十一讲,本讲为第十一讲,主要介绍RL的各类拾遗,包括POMDP、鲁棒性、多智能体、元学习、逆强化学习以及训练平台等。
2021-07-09 21:06:30
4.5MB
强化学习
最优控制
POMDP
李升波教授
1
李升波-强化学习与控制-第三讲
本课程为强化学习与控制,由清华大学开设,长聘教授李升波主讲,共十一讲,本讲为第三讲,主要介绍免模型学习的蒙特卡洛法,包括Monte Carlo估计,On-policy/off-policy,重要性采样等。
2021-07-09 21:06:26
2.63MB
强化学习
最优控制
蒙特卡洛法
李升波教授
1
李升波-强化学习与控制-第五讲
本课程为强化学习与控制,由清华大学开设,长聘教授李升波主讲,共十一讲,本讲为第五讲,主要介绍介绍带模型学习的动态规划法,包括策略迭代、值迭代、收敛性原理等。
2021-07-09 16:08:10
3.42MB
强化学习
最优控制
动态规划
李升波教授
1
李升波-强化学习与控制-第六讲
本课程为强化学习与控制,由清华大学开设,长聘教授李升波主讲,共十一讲,本讲为第六讲,主要介绍间接型RL的函数近似方法,包括常用近似函数,值函数近似,策略函数近似以及所衍生的Actor-critic架构等。
2021-07-09 16:08:09
2.31MB
强化学习
最优控制
李升波教授
间接型RL
1
李升波-强化学习与控制-第七讲
本课程为强化学习与控制,由清华大学开设,长聘教授李升波主讲,共十一讲,本讲为第七讲,主要介绍直接型RL的策略梯度法,包括各类Policy Gradient, 以及如何从优化的观点看待RL等。
2021-07-09 16:08:09
2.17MB
强化学习
最优控制
李升波教授
策略梯度法
1
李升波-强化学习与控制-第八讲
本课程为强化学习与控制,由清华大学开设,长聘教授李升波主讲,共十一讲,本讲为第八讲,主要介绍深度强化学习,即以神经网络为载体的RL,包括深度化典型挑战、经验性处理技巧等。
2021-07-09 16:08:08
3.87MB
强化学习
最优控制
李升波教授
深度强化学习
1
李升波-强化学习与控制-第九讲
本课程为强化学习与控制,由清华大学开设,长聘教授李升波主讲,共十一讲,本讲为第九讲,主要介绍带模型的强化学习,即近似动态规划,包括离散时间系统的ADP,ADP与MPC的关联分析等。
2021-07-09 16:08:08
2.41MB
强化学习
最优控制
近似动态规划
李升波教授
1
李升波-强化学习与控制-第十讲
本课程为强化学习与控制,由清华大学开设,长聘教授李升波主讲,共十一讲,本讲为第十讲,主要介绍有限时域的近似动态规划,同时介绍了状态约束的处理手段以及它与可行性之间的关系。
2021-07-09 16:08:07
3.49MB
强化学习
最优控制
近似动态规划
李升波教授
1
李升波-强化学习与控制-第一讲
本课程为清华大学强化学习与控制,由清华大学长聘教授李升波主讲,共十一讲,本讲为第一讲,主要介绍RL概况,包括发展历史、知名学者、典型应用以及主要挑战等。
2021-07-09 16:08:04
3.7MB
强化学习
最优控制
李升波教授
强化学习概况
1
李升波-强化学习与控制-第四讲
本课程为强化学习与控制,由清华大学开设,长聘教授李升波主讲,共十一讲,本讲为第四讲,主要介绍免模型学习的时序差分法,包括它衍生的Sarsa,Q-learning,Expected Sarsa等算法。
2021-07-09 16:08:03
2.4MB
强化学习
最优控制
时序差分法
李升波教授
1
个人信息
点我去登录
购买积分
下载历史
恢复订单
热门下载
简易示波器-精英板.zip
2020年数学建模国赛C题论文
基于VMD算法的信号降噪.rar
超大规模集成电路先进光刻理论与应用.pdf
基于hadoop商品推荐系统课程设计
voc车辆检测数据集(已处理好,可直接训练)
鲸鱼优化算法 WOA matlab源代码(详细注释)
MATLAB车牌识别系统
中小型企业网络建设.pkt
代码随想录知识星球精华-大厂面试八股文第二版v1.2.pdf
校园网规划与设计和pkt文件
2010年-2020中国地面气候资料数据集(V3.0)
Elsevier爱思唯尔的word模板.zip
现代操作系统原理与实现.pdf
非线性本构关系在ABAQUS中的实现.pdf
最新下载
PcanView(汉化版)
FreeNAS-9.2.1.7-RELEASE-x64.iso
Differential Privacy From Theory to Practice.pdf
师学宝视频自动学习软件
kzllyy template20181214.zip
UT音效包完整版.7z
QYT8900车台说明书
Pointers On C
极域课堂管理系统软件v6.0-2.7.17466 2023专业版
DCNv2-master.zip
其他资源
C# SQL教师信息管理系统
5G 3GPP 协议规范
德州扑克 华为2015编程大赛
RTL8723BS-_datasheet.pdf
Arcgis中利用python语言对shp文件批量计算面积
信号检测与估计matlab仿真
matlab使用gabor变换和神经网络实现人脸识别。可用。
mongo-java-driver-3.12.7.jar
共享名片小程序4.7.12 全开源版含前后端
HMM工具箱,隐马尔可夫matlab工具
GIS地理信息系统专业_毕业设计(论文)开题报告
昆石高速交通事故数据
51单片机POV趣味制作详解(完整版)
学生信息管理系统
基于n-gram卷积神经网络的MoRF预测
web打印动态分页生成PDF插件,项目地址.txt
visual c++在MFC和ATL工程中使用GIF动画.zip
51单片机技术文档&用户手册(英文原版)
小米兰亭字体
labelImg-master.zip
JAVA做的学校教务管理系统