上传者: 38631454
|
上传时间: 2022-03-09 18:11:42
|
文件大小: 406KB
|
文件类型: -
该软件是一个游乐场,专门针对具有多种设置的详细学习强化学习(RL)。 游乐场的核心基于一个移动机器人模型,称为所谓的“扩展非完整双积分器”(ENDI)。 有关说明,请参见这些注释。 整个代码的流程图可以在这里找到。 基本上,代理(也称为“控制器”)附加到环境(系统)并生成动作,以便在未来无限的范围内最小化运行成本(也称为奖励或阶段成本)。 这个软件包中的具体目标是让机器人停放。 控制器是多模态的,允许与各种基线进行比较(标称停车控制器、带有和不带有动态模型估计的模型预测控制器)。