行业分类-物理装置-数据驱动的故障诊断与最优控制系统一体化设计方法.zip
周克敏的经典鲁棒书籍,可以当字典用, 非常难得
2021-07-21 20:13:28 9.99MB 鲁棒
1
文中分析了悬臂梁的振动情况,建立了悬臂梁的动力学系统方程,设计了基于最优模糊控制算法的悬臂梁振动控制系统。系统将采集进来的信号通过最优控制理论计算得到理论输出值,建立拥有最优解的模糊控制规则,使得一个输入得到一个最优的控制输出,从而产生相应的抑制力来减弱梁的振动。使用Matlab对振动控制系统进行了仿真,结果表明该算法能够很好地抑制悬臂梁的振动。
1
加州伯克利数学学院(Department of Mathematics, University of California, Berkeley)Lawrence C. Evans教授的最优控制笔记,非常简明扼要。原版没有目录,我添加了目录: 1 Introduction 3 2 Controllability, bang-bang principle 15 3 Linear time-optimal control 31 4 The Pontryagin Maximum Principle 41 5 Dynamic programming 72 6 Differential Game theory 88 7 Introduction to stochastic control theory 96 Appendix Proofs of the Pontryagin Maximum Principle 110
2021-07-12 16:36:46 698KB 最优控制 深度学习 数学 动态规划
1
清华大学智能驾驶实验室官网:http://www.idlab-tsinghua.com/thulab/labweb/index.html 本课程为强化学习与控制,由清华大学开设,长聘教授李升波主讲,共十一讲,本讲为第十一讲,主要介绍RL的各类拾遗,包括POMDP、鲁棒性、多智能体、元学习、逆强化学习以及训练平台等。
2021-07-09 21:06:30 4.5MB 强化学习 最优控制 POMDP 李升波教授
1
本课程为强化学习与控制,由清华大学开设,长聘教授李升波主讲,共十一讲,本讲为第三讲,主要介绍免模型学习的蒙特卡洛法,包括Monte Carlo估计,On-policy/off-policy,重要性采样等。
1
本课程为强化学习与控制,由清华大学开设,长聘教授李升波主讲,共十一讲,本讲为第五讲,主要介绍介绍带模型学习的动态规划法,包括策略迭代、值迭代、收敛性原理等。
1
本课程为强化学习与控制,由清华大学开设,长聘教授李升波主讲,共十一讲,本讲为第六讲,主要介绍间接型RL的函数近似方法,包括常用近似函数,值函数近似,策略函数近似以及所衍生的Actor-critic架构等。
1
本课程为强化学习与控制,由清华大学开设,长聘教授李升波主讲,共十一讲,本讲为第七讲,主要介绍直接型RL的策略梯度法,包括各类Policy Gradient, 以及如何从优化的观点看待RL等。
1
本课程为强化学习与控制,由清华大学开设,长聘教授李升波主讲,共十一讲,本讲为第八讲,主要介绍深度强化学习,即以神经网络为载体的RL,包括深度化典型挑战、经验性处理技巧等。
1