本课程为强化学习与控制,由清华大学开设,长聘教授李升波主讲,共十一讲,本讲为第二讲,主要介绍RL的基础知识,包括定义概念、自洽条件、最优性原理问题架构等。
1
本课程为强化学习与控制,由清华大学开设,长聘教授李升波主讲,共十一讲,本讲为第四讲,主要介绍免模型学习的时序差分法,包括它衍生的Sarsa,Q-learning,Expected Sarsa等算法。
1
最优化方法与最优控制(研究生用)第一章最优化方法的一般概念第二章非线性规划第三章线性规划第四章最优控制与变分法第五章最小值定理第六章线性二次型最优控制系统第七章动态规划
2021-07-08 15:53:54 3.75MB 习题
1
强化学习和最优控制的《十个关键点》81页PPT汇总。本实验室主要面向于深度强化学习领域,分享包括但不限于深度强化学习Environment、理论推导与算法实现、前沿技术与论文解读、开源项目、应用场景、业界资讯等,同时包括基础数学、经典控制、博弈论、交叉学科等领域知识。
2021-07-01 16:47:15 4.83MB RL
1
绝对可以用的二级倒立摆模型。simulink建模,matlab编写s函数,使用lqr最优控制亲测可用, 谢谢支持。
2021-07-01 14:55:05 580KB 二级倒立摆
1
最优控制课后习题答案,有详细的解答(注意:只有部分习题答案,非全部内容:2-11、3-8、4-4、5-5、5-8、5-9、5-10)。
2021-06-30 11:06:26 215KB 最优控制
1
为提高电动汽车的安全性,详细分析了电动汽车纵向控制过程,构建了车辆安全距离模型,结合实际避撞需求设计了纵向控制器,并利用Matlab软件对设计的电动汽车主动安全避撞控制方法进行仿真分析.结果表明:提出的电动汽车主动安全避撞控制方法可满足车辆安全避撞需求,控制方法合理有效.
2021-06-24 22:03:20 1.58MB Matlab 电动汽车 避撞控制 最优控制
这是 bang-bang 控制器的一个例子。 问题陈述取自 Optimal Control Systems by DS Naidu,第 1 页。 306,这是关于质量为“m”的块在无摩擦环境中受到外力 f(t) 时的简单运动。 运动描述如下: m * y''(t)= f(t) 其中,y(t) 是时间 t 时块的位置,因此,y'(t) 和 y"(t) 分别表示块的速度和加速度。 在 Simulink 模型中,x_1 是模块位置 (y) 的状态变量,x_2 是模块速度 (y') 的状态变量。 初始条件可以在它们各自的块中改变。 控制输入​​可以从标记为“控制输入”的范围内可视化。
2021-06-21 15:21:49 22KB matlab
1
线性二次型系统,采用最优控制器,同时应用MATLAB编程来实现
2021-06-21 11:21:21 204KB 线性二次型 最优控制器 MATLAB
1
本文介绍了线性二次型最优控制的基本原理,并给定了一个具体的控制系统,利用MATLAB软件对其最优控制矩阵进行了求解,最后用SIMULINK对所给定的系统进行了仿真,通过仿真实验,设计所得到的线性二次型最优控制效果比较好,达到了设计的目的。
2021-06-21 11:19:14 63KB MATLAB 线型二次型 最优控制 SIMULINK
1