只为小站
首页
域名查询
文件下载
登录
李升波-强化学习与控制-第十一讲
清华大学智能驾驶实验室官网:http://www.idlab-tsinghua.com/thulab/labweb/index.html 本课程为强化学习与控制,由清华大学开设,长聘教授李升波主讲,共十一讲,本讲为第十一讲,主要介绍RL的各类拾遗,包括POMDP、鲁棒性、多智能体、元学习、逆强化学习以及训练平台等。
2021-07-09 21:06:30
4.5MB
强化学习
最优控制
POMDP
李升波教授
1
李升波-强化学习与控制-第三讲
本课程为强化学习与控制,由清华大学开设,长聘教授李升波主讲,共十一讲,本讲为第三讲,主要介绍免模型学习的蒙特卡洛法,包括Monte Carlo估计,On-policy/off-policy,重要性采样等。
2021-07-09 21:06:26
2.63MB
强化学习
最优控制
蒙特卡洛法
李升波教授
1
李升波-强化学习与控制-第五讲
本课程为强化学习与控制,由清华大学开设,长聘教授李升波主讲,共十一讲,本讲为第五讲,主要介绍介绍带模型学习的动态规划法,包括策略迭代、值迭代、收敛性原理等。
2021-07-09 16:08:10
3.42MB
强化学习
最优控制
动态规划
李升波教授
1
李升波-强化学习与控制-第六讲
本课程为强化学习与控制,由清华大学开设,长聘教授李升波主讲,共十一讲,本讲为第六讲,主要介绍间接型RL的函数近似方法,包括常用近似函数,值函数近似,策略函数近似以及所衍生的Actor-critic架构等。
2021-07-09 16:08:09
2.31MB
强化学习
最优控制
李升波教授
间接型RL
1
李升波-强化学习与控制-第七讲
本课程为强化学习与控制,由清华大学开设,长聘教授李升波主讲,共十一讲,本讲为第七讲,主要介绍直接型RL的策略梯度法,包括各类Policy Gradient, 以及如何从优化的观点看待RL等。
2021-07-09 16:08:09
2.17MB
强化学习
最优控制
李升波教授
策略梯度法
1
李升波-强化学习与控制-第八讲
本课程为强化学习与控制,由清华大学开设,长聘教授李升波主讲,共十一讲,本讲为第八讲,主要介绍深度强化学习,即以神经网络为载体的RL,包括深度化典型挑战、经验性处理技巧等。
2021-07-09 16:08:08
3.87MB
强化学习
最优控制
李升波教授
深度强化学习
1
李升波-强化学习与控制-第九讲
本课程为强化学习与控制,由清华大学开设,长聘教授李升波主讲,共十一讲,本讲为第九讲,主要介绍带模型的强化学习,即近似动态规划,包括离散时间系统的ADP,ADP与MPC的关联分析等。
2021-07-09 16:08:08
2.41MB
强化学习
最优控制
近似动态规划
李升波教授
1
李升波-强化学习与控制-第十讲
本课程为强化学习与控制,由清华大学开设,长聘教授李升波主讲,共十一讲,本讲为第十讲,主要介绍有限时域的近似动态规划,同时介绍了状态约束的处理手段以及它与可行性之间的关系。
2021-07-09 16:08:07
3.49MB
强化学习
最优控制
近似动态规划
李升波教授
1
李升波-强化学习与控制-第一讲
本课程为清华大学强化学习与控制,由清华大学长聘教授李升波主讲,共十一讲,本讲为第一讲,主要介绍RL概况,包括发展历史、知名学者、典型应用以及主要挑战等。
2021-07-09 16:08:04
3.7MB
强化学习
最优控制
李升波教授
强化学习概况
1
李升波-强化学习与控制-第四讲
本课程为强化学习与控制,由清华大学开设,长聘教授李升波主讲,共十一讲,本讲为第四讲,主要介绍免模型学习的时序差分法,包括它衍生的Sarsa,Q-learning,Expected Sarsa等算法。
2021-07-09 16:08:03
2.4MB
强化学习
最优控制
时序差分法
李升波教授
1
个人信息
点我去登录
购买积分
下载历史
恢复订单
热门下载
csma/ca和csma/cd的matlab仿真源代码带有详细的注释
中国地面气候资料日值数据集(V3.0)2014-2019.zip
MVDR,Capon波束形成DO估计.zip
刚萨雷斯《数字图像处理》第四版答案.pdf
通过svm cnn knn对高光谱数据集PaviaU进行分类(matlab)
Autojs 例子 源码 1600多个教程源码
故障诊断数据集及实现代码
房价预测的BP神经网络实现_python代码
长江流域shp.zip
java-spring-web-外文文献翻译40篇.zip
2019西门子杯六部十层电梯群控参考程序.zip
基于OpenCV的车牌号码识别的Python代码(可直接运行)
(推荐)小爱触屏音箱LX04_2.34.5-官改-(开发版)SP5
非线性本构关系在ABAQUS中的实现.pdf
C4.5决策树算法的Python代码和数据样本
最新下载
vox-adv-cpk.pth.tar
gcc-arm-none-eabi-9-2019-q4-major-win32.7z
历史上的今天数据库
AutoScriptWriter v2.0.zip
MT5双线MACD.zip
STM32cubeIDE 1.8.0
世界海用雷达手册.pdf
LabVIEW_MathScript_RT_Module_2017_x86_Downloadly.ir.rar
《数据库系统概论》王珊,讲义PPT
KRterm E控系列 v1.2.2 汉化版(含原版安装程序)
其他资源
stm32f103+ad7685 AD采集程序
director插件集Xtras
使用stm32F4的usb驱动4G模块
PWM移相全桥模块simulink仿真
Linux下的软路由
matlab开发-多变量决策树
机械振动与模态分析基础
2017年美赛D题O奖论文.rar
Android心率检测,计步器,定时提醒
关于sg3525的一些典型应用电路
HALCON图像处理。识别视野中球的个数
前端代码规范总结(3篇).zip
星间光通信链路稳定保持时间估算
SQLite快速插入代码模板
FastDivide:比硬件更快地划分64位整数。 或针对给定的标称进行预计算并快速重复除法-源码
editor-gui:GUI库,用于基于javascript canvas的开发工具和编辑器-源码
titanic.zip
老V2016内核过驱动保护课件.rar
Eclipse汉化包 版本Photon Release (4.8.0)
安卓 检测周边声音分贝数
数字会说话-ERP中的财务管理
LuaStudio7.23 完美破解版本