tetris-ai:玩俄罗斯方块的深度强化学习机器人-源码

tetris deep-reinforcement-learning q-learning game-ai

俄罗斯方块使用深度强化学习的机器人。演示版经过一些训练后，首先获得10000分。它是如何工作的强化学习首先，代理将进行随机移动，将状态和给定的奖励保存在有限的队列（重播内存）中。在每个情节（游戏）结束时，代理将使用重播内存的随机样本来训练自己（使用神经网络）。随着玩越来越多的游戏，代理变得越来越聪明，得分越来越高。由于在强化学习中，一旦特工发现了良好的“路径”，它就会坚持下去，因此它也被视为探索变量（随时间而减小），因此特工有时会选择一种随机动作，而不是它认为最佳的动作。。这样，它可以发现新的“路径”以获得更高的分数。训练培训基于。相反，只使用所获得的当前状态，并奖励对网络进行训练的，它是用来Q学习（即认为从当前状态到未来的一个过渡），以找出什么是考虑到所有给定状态的最佳成绩未来的回报，即算法不是贪婪的。这使代理可以采取一些可能无法立即获得回报的举动，因此以

文件下载

资源详情

[{"title":"（ 8 个子文件 3.8MB ） tetris-ai:玩俄罗斯方块的深度强化学习机器人-源码","children":[{"title":"tetris-ai-master","children":[{"title":"dqn_agent.py 5.26KB ","children":null,"spread":false},{"title":"logs.py 369B ","children":null,"spread":false},{"title":"run.py 2.58KB ","children":null,"spread":false},{"title":"requirements.txt 66B ","children":null,"spread":false},{"title":"README.md 4.99KB ","children":null,"spread":false},{"title":"tetris.py 9.91KB ","children":null,"spread":false},{"title":"results.svg 31.07KB ","children":null,"spread":false},{"title":"demo.gif 7.58MB ","children":null,"spread":false}],"spread":true}],"spread":true}]

评论信息

其他资源

免责申明

【只为小站】的资源来自网友分享，仅供学习研究，请务必在下载后24小时内给予删除，不得用于其他任何用途，否则后果自负。基于互联网的特殊性，【只为小站】无法对用户传输的作品、信息、内容的权属或合法性、合规性、真实性、科学性、完整权、有效性等进行实质审查；无论【只为小站】经营者是否已进行审查，用户均应自行承担因其传输的作品、信息、内容而可能或已经产生的侵权或权属纠纷等法律责任。
本站所有资源不代表本站的观点或立场，基于网友分享，根据中国法律《信息网络传播权保护条例》第二十二条之规定，若资源存在侵权或相关问题请联系本站客服人员，zhiweidada#qq.com，请把#换成@，本站将给予最大的支持与配合，做到及时反馈和处理。关于更多版权及免责申明参见版权及免责申明

tetris-ai:玩俄罗斯方块的深度强化学习机器人-源码

文件下载

资源详情

评论信息

其他资源

免责申明

个人信息

热门下载

最新下载