搜索【李升波教授】的结果

李升波-强化学习与控制-第十一讲

清华大学智能驾驶实验室官网：http://www.idlab-tsinghua.com/thulab/labweb/index.html 本课程为强化学习与控制，由清华大学开设，长聘教授李升波主讲，共十一讲，本讲为第十一讲，主要介绍RL的各类拾遗，包括POMDP、鲁棒性、多智能体、元学习、逆强化学习以及训练平台等。

2021-07-09 21:06:30 4.5MB 强化学习 最优控制 POMDP 李升波教授

1

李升波-强化学习与控制-第三讲

本课程为强化学习与控制，由清华大学开设，长聘教授李升波主讲，共十一讲，本讲为第三讲，主要介绍免模型学习的蒙特卡洛法，包括Monte Carlo估计，On-policy/off-policy，重要性采样等。

2021-07-09 21:06:26 2.63MB 强化学习 最优控制 蒙特卡洛法 李升波教授

1

李升波-强化学习与控制-第五讲

本课程为强化学习与控制，由清华大学开设，长聘教授李升波主讲，共十一讲，本讲为第五讲，主要介绍介绍带模型学习的动态规划法，包括策略迭代、值迭代、收敛性原理等。

2021-07-09 16:08:10 3.42MB 强化学习 最优控制 动态规划 李升波教授

1

李升波-强化学习与控制-第六讲

本课程为强化学习与控制，由清华大学开设，长聘教授李升波主讲，共十一讲，本讲为第六讲，主要介绍间接型RL的函数近似方法，包括常用近似函数，值函数近似，策略函数近似以及所衍生的Actor-critic架构等。

2021-07-09 16:08:09 2.31MB 强化学习 最优控制 李升波教授 间接型RL

1

李升波-强化学习与控制-第七讲

本课程为强化学习与控制，由清华大学开设，长聘教授李升波主讲，共十一讲，本讲为第七讲，主要介绍直接型RL的策略梯度法，包括各类Policy Gradient, 以及如何从优化的观点看待RL等。

2021-07-09 16:08:09 2.17MB 强化学习 最优控制 李升波教授 策略梯度法

1

李升波-强化学习与控制-第八讲

本课程为强化学习与控制，由清华大学开设，长聘教授李升波主讲，共十一讲，本讲为第八讲，主要介绍深度强化学习，即以神经网络为载体的RL，包括深度化典型挑战、经验性处理技巧等。

2021-07-09 16:08:08 3.87MB 强化学习 最优控制 李升波教授 深度强化学习

1

李升波-强化学习与控制-第九讲

本课程为强化学习与控制，由清华大学开设，长聘教授李升波主讲，共十一讲，本讲为第九讲，主要介绍带模型的强化学习，即近似动态规划，包括离散时间系统的ADP，ADP与MPC的关联分析等。

2021-07-09 16:08:08 2.41MB 强化学习 最优控制 近似动态规划 李升波教授

1

李升波-强化学习与控制-第十讲

本课程为强化学习与控制，由清华大学开设，长聘教授李升波主讲，共十一讲，本讲为第十讲，主要介绍有限时域的近似动态规划，同时介绍了状态约束的处理手段以及它与可行性之间的关系。

2021-07-09 16:08:07 3.49MB 强化学习 最优控制 近似动态规划 李升波教授

1

李升波-强化学习与控制-第一讲

本课程为清华大学强化学习与控制，由清华大学长聘教授李升波主讲，共十一讲，本讲为第一讲，主要介绍RL概况，包括发展历史、知名学者、典型应用以及主要挑战等。

2021-07-09 16:08:04 3.7MB 强化学习 最优控制 李升波教授 强化学习概况

1

李升波-强化学习与控制-第四讲

本课程为强化学习与控制，由清华大学开设，长聘教授李升波主讲，共十一讲，本讲为第四讲，主要介绍免模型学习的时序差分法，包括它衍生的Sarsa，Q-learning，Expected Sarsa等算法。

2021-07-09 16:08:03 2.4MB 强化学习 最优控制 时序差分法 李升波教授

1

个人信息

热门下载

最新下载

其他资源