[PYTORCH]扮演超级马里奥兄弟的非同步优势演员评判(A3C) 介绍 这是我的python源代码,用于训练特工玩超级马里奥兄弟。 通过使用纸异步方法用于深强化学习引入异步优势演员,评论家(A3C)算法。 样品结果 动机 在我实施该项目之前,有多个存储库可以很好地重现本文的结果,这些存储库可以在Tensorflow,Keras和Pytorch等不同的常见深度学习框架中进行。 我认为,其中大多数都很棒。 但是,它们似乎在许多方面都过于复杂,包括图像的预处理,环境设置和权重初始化,这使用户的注意力从更重要的事情上转移了。 因此,我决定编写更简洁的代码,以简化不重要的部分,同时仍然严格
2023-02-06 16:42:14 300.86MB python mario reinforcement-learning ai
1
使用GNU工具链进行STM32f103开发 版权所有(C)2018 Frank Curie(邱日) 我们将NES()仿真器移植到了Alientek Worship(v3)stm32f103zet6开发板上。这是Super Mario Bros的演示。 在线视频: 用法 git clone 然后CD进入“ stm32f103_NES_Mario / Mario”目录 通过J-link线将Alientek Worship STM32f103开发板连接至计算机,并打开电源。 “ make”然后“ make jlink”,一切都会好的。 :) 现在,您可以使用Joypad控制Mario。 注意事项 只有一个玩家。 真的很慢。 我只测试了《超级马里奥兄弟》,但支持其他大多数NES游戏。 您只需在stm32f103_NES_Mario / Mario / qiuri_lib / NE
2022-12-04 15:49:50 15.99MB nes gnu-toolchain stm32f103 super-mario-bros
1
Mario重机版 马里奥重机版
2022-07-05 12:05:40 117.87MB 马里奥
1
IOS应用源码之Amnysia-Mario-4ff4f2f.zip
2022-06-21 09:10:07 4.57MB IOS应用源码
自我监督预测的好奇心驱动探索 在ICML 2017中 , , ,加州大学伯克利分校 这是我们基于ICLS 基于张量流的实现,该。 当来自环境的外部奖励稀疏时,想法是用内在的基于好奇心的动机(ICM)来培训代理商。 令人惊讶的是,即使环境中没有可用的奖励,您也可以使用ICM,在这种情况下,代理仅出于好奇而学会探索:“没有奖励的RL”。 如果您发现这项工作对您的研究有用,请引用: @inproceedings{pathakICMl17curiosity, Author = {Pathak, Deepak and Agrawal, Pulkit and Ef
2022-05-30 14:48:41 2.04MB mario deep-neural-networks deep-learning tensorflow
1
2d Greenfoot-game-MARIO
2022-05-29 11:49:15 6MB Java
1
使用马里奥的手套作为鼠标指针,超酷(附安装说明)
2022-05-21 09:01:16 57KB 综合资源 鼠标指针
Mario,收集的一些图片,共享给需要的童鞋
2022-05-13 12:15:30 9.44MB Mario,图片
1
DOS版本的超级玛丽,mario 1994绝版下载,在WIN98和dos下可玩。
2022-04-06 03:08:25 57KB 超级玛丽 dos版本
1
java实现的马里奥源码
2021-12-29 17:02:57 6.86MB java
1