reinforcementlearningmario:该项目的目的是实施最先进的深度强化学习方法，即近距离策略优化（PPO），以培训代理人以完成超级马里奥兄弟世界第一的水平

reinforcement-learning Python

超级马里奥兄弟的深度强化学习描述背景信息：超级马里奥兄弟（SMB）是一款流行的动作游戏，具有“真实的”环境和广阔的状态空间，是设计可玩计算机游戏的强化学习代理的理想平台。该代理要求与世界上的各种对象和障碍进行交互，以鼓励采用知识丰富的学习方法。方法-我们使用了OpenAI Gym提供的框架。超级马里奥兄弟体育馆并从游戏环境中提取了信息，以使用PPO训练RL特工。我们还向环境引入了预处理方法，例如帧缩放，随机跳帧，帧堆叠和噪声网，以提高代理的性能。通过引入回滚操作来提高训练的稳定性，可以创建PPO的变体。结果：该方法成功地训练了能够在20个小时的训练后完成水平的特工。我们成功实现了一种方法，该方法可以比常规PPO实施更好地执行，在不应用数据预处理的情况下性能提高了50％，在应用数据预处理的情况下性能提高了10％。工具 Pytorch已被用作主要的机器学习库由于SMB

文件下载

评论信息

其他资源

免责申明

【只为小站】的资源来自网友分享，仅供学习研究，请务必在下载后24小时内给予删除，不得用于其他任何用途，否则后果自负。基于互联网的特殊性，【只为小站】无法对用户传输的作品、信息、内容的权属或合法性、合规性、真实性、科学性、完整权、有效性等进行实质审查；无论【只为小站】经营者是否已进行审查，用户均应自行承担因其传输的作品、信息、内容而可能或已经产生的侵权或权属纠纷等法律责任。
本站所有资源不代表本站的观点或立场，基于网友分享，根据中国法律《信息网络传播权保护条例》第二十二条之规定，若资源存在侵权或相关问题请联系本站客服人员，zhiweidada#qq.com，请把#换成@，本站将给予最大的支持与配合，做到及时反馈和处理。关于更多版权及免责申明参见版权及免责申明

reinforcementlearningmario:该项目的目的是实施最先进的深度强化学习方法，即近距离策略优化（PPO），以培训代理人以完成超级马里奥兄弟世界第一的水平

文件下载

评论信息

其他资源

免责申明

个人信息

相关资源标签

热门下载

最新下载