提出一类非线性不确定动态系统基于强化学习的最优控制方法. 该方法利用欧拉强化学习算法估计对象的未知非线性函数, 给出了强化学习中回报函数和策略函数迭代的在线学习规则. 通过采用向前欧拉差分迭代公式对学习过程中的时序误差进行离散化, 实现了对值函数的估计和控制策略的改进. 基于值函数的梯度值和时序误差指标值, 给出了该算法的步骤和误差估计定理. 小车爬山问题的仿真结果表明了所提出方法的有效性.

1
复合材料最优控制与结构优化设计中的多尺度模型与算法.pdf
2022-07-11 14:12:17 8.74MB 文档资料
在生产过程、军事行动、经济活动以及人类的其它有目的的活动中,常需要对被控系统或被控过程施加某种控制作用以使某个性能指标达到最优,这种控制作用称为最优控制
2022-07-05 19:58:43 5.32MB 最优控制
1
1.本完档是我matlab实习的左右文档,包含源代码和讲解、试验采集的数据(用于神经网络的)、固高的用户手册等。 2.实验效果完美,我都是一次过,倒立摆稳得一笔。尤其是神经网络训练部分,设置拟合度为0.000001别人训练2000多次成功,我的数据只需要500次不到甚至更少!!!无论你的机器多老(考核时候用的是2006年的大屁股机器,这都2019年了,稳稳地可以用)。 3.我拟合度自己都设置到0.00000000000000000001,都成功过!!!!!!!!!
1
绝对可以用的二级倒立摆模型。simulink建模,matlab编写s函数,使用lqr最优控制
2022-06-15 15:15:11 580KB 二级倒立摆
1
matlab代码的优化分析自述文件(基本多间隔伪光谱) 该项目采用多区间伪谱方法来解决最优控制问题。 安装 下载 在 MATLAB 命令行窗口中运行(自动将项目文件添加到您的 MATLAB 路径、下载所需文件并打开示例) INSTALL_Basic_Pseudospectral 请参阅运行 Bryson-Denham 示例 open BD_main 理论和案例研究结果见技术报告 引文 该代码是以下出版物的补充材料: 赫伯博士。 解决最优控制问题的多区间伪谱方法的基本实现。 技术报告,工程系统设计实验室,UIUC-ESDL-2015-01,美国伊利诺伊州厄巴纳,2015 年 6 月。 描述 使用了两种数值方案:具有 LGL 节点的 Legendre 伪谱方法和具有 CGL 节点的 Chebyshev 伪谱方法。 使用 Bryson-Denham 问题的案例研究结果证明了用户选择网格参数的影响以及两种数值伪光谱方案之间的差异很小。 求解过程独立于 Bryson-Denham 问题测试,因此可以使用随附的代码解决其他最优控制问题。 本次投稿的主要目的是为多区间伪谱方法的基本实现提供参考。 结
2022-06-01 01:15:38 78KB 系统开源
1
基于计时Petri网和极大代数理论构建了串行生产线的稳态方程,并对其进行了周期分析。以此为基础,建立了串行生产线生产率控制模型。应用变分法求解模型,并在Maflab平台上对模型进行了仿真运算。结果表明,在满足生产工艺要求的前提下,要保证生产线的高生产率,生产线上瓶颈工作站的位置应尽量靠近生产线尾端;生产线上各工作站的生产率应呈依次下降的趋势;每个缓冲区理想的在制品库存量应尽量接近其初始库存量。在进行串行生产线设计时,这些结论具有实际参考价值。
2022-05-31 11:31:38 165KB 生产率 计时Petri网 最优控制
1
控制系统的应用中存在状态不能直接测量或测量成本高的实际问题,给模型参数未知的系统完全利用状态数据学习最优控制器带来挑战性难题.为解决这一问题,首先构建具有状态观测器且系统矩阵中存在未知参数的离散线性增广系统,定义性能优化指标;然后基于分离定理、动态规划以及Q-学习方法,给出一种具有未知模型参数的非策略Q-学习算法,并设计近似最优观测器,得到完全利用可测量的系统输出和控制输入数据的非策略Q-学习算法,实现基于观测器状态反馈的系统优化控制策略,该算法的优点在于不要求系统模型参数全部已知,不要求系统状态直接可测,利用可测量数据实现指定性能指标的优化;最后,通过仿真实验验证所提出方法的有效性.
1
研究生《最优控制》期末试卷2020真题;Problems for examination 1) Explain briefly the features of the main approaches and the relationship between these approaches used to solve optimal control problems. (15 points);
2022-05-23 14:03:42 138KB 最优控制 期末考试 中南大学
研究生《最优控制》期末试卷2021真题;Problems for examination 1) Explain briefly the features of the main approaches and the relationship between these approaches used to solve optimal control problems. (20 points);
2022-05-23 14:03:41 163KB 最优控制 期末考试 中南大学