pytorch-DQN:DQN的Pytorch实现

Python

pytorch-DQN DQN的Pytorch实现 DQN 最初的Q学习使用表格方法（有关更多详细信息和实现，请参见）来解决，但是，表格Q学习的问题在状态增长时出现因为table不足以存储环境中给定的数亿个状态。例如，环境为210x180黑白像素的游戏。将有$ 2 ^ {180 * 210} $个可能的状态，对于一个表来说，这太多了。 DeepMind通过深度神经网络以DQN形式将DQN形式的深度学习和Q学习相结合，以近似值，首先在游戏中击败人类。简而言之，DQN用深度神经网络（CNN或DNN）替换了表格，并使用目标网络来执行Bellman方程更新。为了实现它，使用了一些技巧，例如目标网络和体验重播。引入目标网络以收敛模型，因为频繁更新会使模型处于不稳定状态。体验重播使用缓冲区存储所有过去（状态，动作，next_state）对，并通过对过去的体验进行采样来训练模型，这有

文件下载

资源详情

[{"title":"（ 24 个子文件 1.5MB ） pytorch-DQN:DQN的Pytorch实现","children":[{"title":"pytorch-DQN-main","children":[{"title":"CartPole-v0.pth 74.05KB ","children":null,"spread":false},{"title":"train.py 3.76KB ","children":null,"spread":false},{"title":"agent.py 3.92KB ","children":null,"spread":false},{"title":"experience_replay.py 1.06KB ","children":null,"spread":false},{"title":"test.py 113B ","children":null,"spread":false},{"title":"images","children":[{"title":"mountainCar_result.gif 358.10KB ","children":null,"spread":false},{"title":"MountainCar.png 125.58KB ","children":null,"spread":false},{"title":"DQN.png 122.44KB ","children":null,"spread":false},{"title":"cartpole_result.gif 675.35KB ","children":null,"spread":false},{"title":"CartPole-v0-reward.svg 82.54KB ","children":null,"spread":false},{"title":"MountainCar-v0-reward.svg 84.67KB ","children":null,"spread":false},{"title":"CartPole-v0.gif 142.91KB ","children":null,"spread":false}],"spread":true},{"title":"Q_network.py 1016B ","children":null,"spread":false},{"title":".vscode","children":[{"title":"settings.json 78B ","children":null,"spread":false}],"spread":true},{"title":"Q_network_pong.py 1.64KB ","children":null,"spread":false},{"title":"train_Pong.py 4.89KB ","children":null,"spread":false},{"title":"LICENSE 1.04KB ","children":null,"spread":false},{"title":"eval.py 1.74KB ","children":null,"spread":false},{"title":"README.md 3.64KB ","children":null,"spread":false},{"title":"runs","children":[{"title":"Mar18_14-56-52_WilliamdeMacBook-Pro.local","children":[{"title":"events.out.tfevents.1616050612.WilliamdeMacBook-Pro.local.1043.0 111.24KB ","children":null,"spread":false}],"spread":false},{"title":"Mar18_14-53-31_WilliamdeMacBook-Pro.local","children":[{"title":"events.out.tfevents.1616050411.WilliamdeMacBook-Pro.local.96246.0 117.10KB ","children":null,"spread":false}],"spread":false}],"spread":false},{"title":"agent_pong.py 3.94KB ","children":null,"spread":false},{"title":".gitignore 1.76KB ","children":null,"spread":false},{"title":"MountainCar-v0.pth 73.55KB ","children":null,"spread":false}],"spread":false}],"spread":true}]

评论信息

其他资源

免责申明

【只为小站】的资源来自网友分享，仅供学习研究，请务必在下载后24小时内给予删除，不得用于其他任何用途，否则后果自负。基于互联网的特殊性，【只为小站】无法对用户传输的作品、信息、内容的权属或合法性、合规性、真实性、科学性、完整权、有效性等进行实质审查；无论【只为小站】经营者是否已进行审查，用户均应自行承担因其传输的作品、信息、内容而可能或已经产生的侵权或权属纠纷等法律责任。
本站所有资源不代表本站的观点或立场，基于网友分享，根据中国法律《信息网络传播权保护条例》第二十二条之规定，若资源存在侵权或相关问题请联系本站客服人员，zhiweidada#qq.com，请把#换成@，本站将给予最大的支持与配合，做到及时反馈和处理。关于更多版权及免责申明参见版权及免责申明

pytorch-DQN:DQN的Pytorch实现

文件下载

资源详情

评论信息

其他资源

免责申明

个人信息

相关资源标签

热门下载

最新下载