上传者: 38717169
|
上传时间: 2022-03-09 18:12:05
|
文件大小: 407KB
|
文件类型: -
离散控制Matlab代码学习RL
学习强化学习(在MATLAB:registered:中)
抽象的
该软件是一个游乐场,专门针对具有多种设置的详细学习强化学习(RL)。
运动场的核心是基于移动机器人的模型,被称为“扩展的非完整双积分器”(ENDI)。
有关说明,请参见。
总体代码流程图可在中找到。
基本上,代理(也称为“控制器”)连接到环境(系统)并生成操作,以使将来在无限远景中的运行成本(也称为奖励或阶段成本)最小化。
因此,此软件包中的特定目标是停放机器人。
该控制器为多模式控制器,可与各种基线进行比较(标称停车控制器,具有和不具有实时模型估计功能的模型预测控制器)。
包装的主要内容
-初始化脚本
-在MATLAB
2018a中,主文件是一个Simulink模型,顾名思义
-包含评论者定义的函数的脚本
-包装成适合在Simulink中使用的形式的状态空间模型的标准估计量
-确定确定合适的初始状态的方法相同
-包含角色定义为功能的脚本
-标称停车控制器的辅助功能
详细内容如下
一般说明
流程图中的大部分内容说明了该软件的不同部分之间如何交互。
它的主要成分是:
系统
标称控制器
由模型估算器,评论家和演员