超级马里奥兄弟的深度强化学习 描述 背景信息:超级马里奥兄弟(SMB)是一款流行的动作游戏,具有“真实的”环境和广阔的状态空间,是设计可玩计算机游戏的强化学习代理的理想平台。 该代理要求与世界上的各种对象和障碍进行交互,以鼓励采用知识丰富的学习方法。 方法-我们使用了OpenAI Gym提供的框架。 超级马里奥兄弟体育馆并从游戏环境中提取了信息,以使用PPO训练RL特工。 我们还向环境引入了预处理方法,例如帧缩放,随机跳帧,帧堆叠和噪声网,以提高代理的性能。 通过引入回滚操作来提高训练的稳定性,可以创建PPO的变体。 结果:该方法成功地训练了能够在20个小时的训练后完成水平的特工。 我们成功实现了一种方法,该方法可以比常规PPO实施更好地执行,在不应用数据预处理的情况下性能提高了50%,在应用数据预处理的情况下性能提高了10%。 工具 Pytorch已被用作主要的机器学习库 由于SMB
2022-11-09 22:52:04 18.11MB reinforcement-learning Python
1
运行代理人销售管理系统系统.
2022-11-02 18:03:27 739KB 运行代理人销售管理系统系统.
1
专利代理人三本 目录知识点总结(思维导图加图) 1专利代理实务分册(第4版) 2专利法律知识分册 3相关法律知识分册(第三版)
2022-07-04 09:06:53 1.39MB 专利
旅行社产品需求原型设计,Axure源文件版本,含wap端,代理人端,分销商。完整需求原型设计,供参考和学习使用。
2022-05-01 14:05:06 6.97MB axure 学习 旅行社产品需求
2021年精选代理人委托书范文锦集八篇.docx
2022-02-09 09:04:50 11KB
代理合同:保险代理人合同范本.docx
2021-12-25 15:02:36 16KB 协议合同
20200304-华创-互联网保险系列报告之一:从传统代理人社交圈到更广阔的互联网流量池
2021-09-04 12:01:56 1.8MB
中国互联网保险代理人生存状况调查报告
保险公司保险代理人激励研究
2021-08-24 19:12:21 1.73MB 保险
1
保险科技背景下寿险个人代理人展业模式创新研究
2021-08-24 19:12:08 1.8MB 保险
1