本课程为强化学习与控制,由清华大学开设,长聘教授李升波主讲,共十一讲,本讲为第二讲,主要介绍RL的基础知识,包括定义概念、自洽条件、最优性原理问题架构等。
1
本课程为强化学习与控制,由清华大学开设,长聘教授李升波主讲,共十一讲,本讲为第四讲,主要介绍免模型学习的时序差分法,包括它衍生的Sarsa,Q-learning,Expected Sarsa等算法。
1
最优化方法与最优控制(研究生用)第一章最优化方法的一般概念第二章非线性规划第三章线性规划第四章最优控制与变分法第五章最小值定理第六章线性二次型最优控制系统第七章动态规划
2021-07-08 15:53:54 3.75MB 习题
1
目前网上多数资源是以LINGO写的,MATLAB 也可以很好地解决此类问题。这里仅包含最后的非线性规划,不包括中间的最短路径的求解,并且带有英文的注释
2021-07-08 15:52:07 3KB MATLAB
1
强化学习和最优控制的《十个关键点》81页PPT汇总。本实验室主要面向于深度强化学习领域,分享包括但不限于深度强化学习Environment、理论推导与算法实现、前沿技术与论文解读、开源项目、应用场景、业界资讯等,同时包括基础数学、经典控制、博弈论、交叉学科等领域知识。
2021-07-01 16:47:15 4.83MB RL
1
绝对可以用的二级倒立摆模型。simulink建模,matlab编写s函数,使用lqr最优控制亲测可用, 谢谢支持。
2021-07-01 14:55:05 580KB 二级倒立摆
1
基于改进高斯伪谱法的运载火箭上升轨迹优化
2021-06-30 17:43:27 190KB 研究论文
1
本文考虑在Chebyshev伪谱方法离散化的齐次Dirichlet边界条件下,在笛卡尔域中求解Helmholtz方程。 本文的主要目的是提出一种两级分解方案,用于将离散化获得的线性系统解耦为独立的子系统。 该方案利用块对角化方法沿一个方向的物理问题的均匀性,将2D问题简化为几个一维问题;沿第二方向的反射性,利用a分解每个1D问题为两个独立的子问题自反分解,有效地使子问题的数量加倍。 基于离散化线性系统系数矩阵的特殊结构和二阶Chebyshev微分矩阵的自反特性,我们表明分解后的子矩阵表现出相似的特性,从而使系统能够使用自反分解进行分解。 得出分解子矩阵的显式形式。 分解不仅产生更有效的算法,而且引入了粗粒度并行性。 此外,它保留了原始矩阵的所有特征值。
1
最优控制课后习题答案,有详细的解答(注意:只有部分习题答案,非全部内容:2-11、3-8、4-4、5-5、5-8、5-9、5-10)。
2021-06-30 11:06:26 215KB 最优控制
1
为提高电动汽车的安全性,详细分析了电动汽车纵向控制过程,构建了车辆安全距离模型,结合实际避撞需求设计了纵向控制器,并利用Matlab软件对设计的电动汽车主动安全避撞控制方法进行仿真分析.结果表明:提出的电动汽车主动安全避撞控制方法可满足车辆安全避撞需求,控制方法合理有效.
2021-06-24 22:03:20 1.58MB Matlab 电动汽车 避撞控制 最优控制