郭一璞 发自 北四环 量子位 报道 | 公众号 QbitAI
把超级马里奥玩成下面这样,算什么水平?
能流畅的行走在妖魔鬼怪之间
能掐准食人花出现的时机
能灵巧的躲过烧火棍
能克服各种变态的地形
从1-1到7-1,只要一条命,就能全部通过,而且操作几乎没有迟疑,如行云流水一般。
不信的可以看完整视频:
别人玩得这么溜,你是不是只能被小乌龟、喷子弹的小怪物、上上下下的地形虐?
不过,这个玩游戏的不是人,是一只通过深度强化学习算法实现的AI。
异步优势演员评论家算法
这个算法已经开源,是2016年的论文《Asynchronous Methods for Deep Reinforcement
1