多点路径规划matlab代码-ReinforcmentLearningRobot:我在MSE本科学位课程最后一个学期的自选选修课的强化学习路径

上传者: 38622611 | 上传时间: 2021-10-08 18:25:23 | 文件大小: 440KB | 文件类型: -
多点路径规划指标机器人强化学习 增强学习已成为研究和研究的热门话题,该领域的许多领域都未曾动过。 这些领域之一是在物理机器人上实施强化学习算法。 我探索了在物理定制3D打印机器人Benny和Bunny上实现RL算法的过程,从A到B。这个项目是我本科生最后一年学习自学选修课的一部分,目的是学习强化学习(RL)的基础知识。 最初,编码直接发生在物理机器人上,但是在项目进行到一半时,很明显项目的算法和硬件需要去耦; 很难确定问题出在硬件还是RL算法中。 在RL算法中进行的仿真测试表明,在较小的状态空间(<= 100个状态)中,结果令人鼓舞,但是一旦问题扩展到包含400个状态的远期奖励,则对于所探索的RL算法中的任何一个都无法收敛。 从仿真结果来看,在硬件上实现可行之前,需要在仿真中探索更强大的算法。 模拟 所有的代码都是用C ++编写的,没有框架或外部库。 这样做有两个原因: 我想要的代码既可以用于模拟训练,也可以用于完全在机器人上完成的训练,而无需进行数据传输。 之所以需要这种可移植性,是因为机器人使用的CPU和内存有限的微控制器,而增加数据传输将为系统增加更多的复杂性。 使用Tensor

文件下载

评论信息

免责申明

【只为小站】的资源来自网友分享,仅供学习研究,请务必在下载后24小时内给予删除,不得用于其他任何用途,否则后果自负。基于互联网的特殊性,【只为小站】 无法对用户传输的作品、信息、内容的权属或合法性、合规性、真实性、科学性、完整权、有效性等进行实质审查;无论 【只为小站】 经营者是否已进行审查,用户均应自行承担因其传输的作品、信息、内容而可能或已经产生的侵权或权属纠纷等法律责任。
本站所有资源不代表本站的观点或立场,基于网友分享,根据中国法律《信息网络传播权保护条例》第二十二条之规定,若资源存在侵权或相关问题请联系本站客服人员,zhiweidada#qq.com,请把#换成@,本站将给予最大的支持与配合,做到及时反馈和处理。关于更多版权及免责申明参见 版权及免责申明