pytorch-DQN:DQN的Pytorch实现

上传者: 42101720 | 上传时间: 2022-11-23 09:47:12 | 文件大小: 1.5MB | 文件类型: ZIP
pytorch-DQN DQN的Pytorch实现 DQN 最初的Q学习使用表格方法(有关更多详细信息和实现,请参见 )来解决,但是,表格Q学习的问题在状态增长时出现因为table不足以存储环境中给定的数亿个状态。 例如,环境为210x180黑白像素的游戏。 将有$ 2 ^ {180 * 210} $个可能的状态,对于一个表来说,这太多了。 DeepMind通过深度神经网络以DQN形式将DQN形式的深度学习和Q学习相结合,以近似值,首先在游戏中击败人类。 简而言之,DQN用深度神经网络(CNN或DNN)替换了表格,并使用目标网络来执行Bellman方程更新。 为了实现它,使用了一些技巧,例如目标网络和体验重播。 引入目标网络以收敛模型,因为频繁更新会使模型处于不稳定状态。 体验重播使用缓冲区存储所有过去(状态,动作,next_state)对,并通过对过去的体验进行采样来训练模型,这有

文件下载

资源详情

[{"title":"( 24 个子文件 1.5MB ) pytorch-DQN:DQN的Pytorch实现","children":[{"title":"pytorch-DQN-main","children":[{"title":"CartPole-v0.pth <span style='color:#111;'> 74.05KB </span>","children":null,"spread":false},{"title":"train.py <span style='color:#111;'> 3.76KB </span>","children":null,"spread":false},{"title":"agent.py <span style='color:#111;'> 3.92KB </span>","children":null,"spread":false},{"title":"experience_replay.py <span style='color:#111;'> 1.06KB </span>","children":null,"spread":false},{"title":"test.py <span style='color:#111;'> 113B </span>","children":null,"spread":false},{"title":"images","children":[{"title":"mountainCar_result.gif <span style='color:#111;'> 358.10KB </span>","children":null,"spread":false},{"title":"MountainCar.png <span style='color:#111;'> 125.58KB </span>","children":null,"spread":false},{"title":"DQN.png <span style='color:#111;'> 122.44KB </span>","children":null,"spread":false},{"title":"cartpole_result.gif <span style='color:#111;'> 675.35KB </span>","children":null,"spread":false},{"title":"CartPole-v0-reward.svg <span style='color:#111;'> 82.54KB </span>","children":null,"spread":false},{"title":"MountainCar-v0-reward.svg <span style='color:#111;'> 84.67KB </span>","children":null,"spread":false},{"title":"CartPole-v0.gif <span style='color:#111;'> 142.91KB </span>","children":null,"spread":false}],"spread":true},{"title":"Q_network.py <span style='color:#111;'> 1016B </span>","children":null,"spread":false},{"title":".vscode","children":[{"title":"settings.json <span style='color:#111;'> 78B </span>","children":null,"spread":false}],"spread":true},{"title":"Q_network_pong.py <span style='color:#111;'> 1.64KB </span>","children":null,"spread":false},{"title":"train_Pong.py <span style='color:#111;'> 4.89KB </span>","children":null,"spread":false},{"title":"LICENSE <span style='color:#111;'> 1.04KB </span>","children":null,"spread":false},{"title":"eval.py <span style='color:#111;'> 1.74KB </span>","children":null,"spread":false},{"title":"README.md <span style='color:#111;'> 3.64KB </span>","children":null,"spread":false},{"title":"runs","children":[{"title":"Mar18_14-56-52_WilliamdeMacBook-Pro.local","children":[{"title":"events.out.tfevents.1616050612.WilliamdeMacBook-Pro.local.1043.0 <span style='color:#111;'> 111.24KB </span>","children":null,"spread":false}],"spread":false},{"title":"Mar18_14-53-31_WilliamdeMacBook-Pro.local","children":[{"title":"events.out.tfevents.1616050411.WilliamdeMacBook-Pro.local.96246.0 <span style='color:#111;'> 117.10KB </span>","children":null,"spread":false}],"spread":false}],"spread":false},{"title":"agent_pong.py <span style='color:#111;'> 3.94KB </span>","children":null,"spread":false},{"title":".gitignore <span style='color:#111;'> 1.76KB </span>","children":null,"spread":false},{"title":"MountainCar-v0.pth <span style='color:#111;'> 73.55KB </span>","children":null,"spread":false}],"spread":false}],"spread":true}]

评论信息

免责申明

【只为小站】的资源来自网友分享,仅供学习研究,请务必在下载后24小时内给予删除,不得用于其他任何用途,否则后果自负。基于互联网的特殊性,【只为小站】 无法对用户传输的作品、信息、内容的权属或合法性、合规性、真实性、科学性、完整权、有效性等进行实质审查;无论 【只为小站】 经营者是否已进行审查,用户均应自行承担因其传输的作品、信息、内容而可能或已经产生的侵权或权属纠纷等法律责任。
本站所有资源不代表本站的观点或立场,基于网友分享,根据中国法律《信息网络传播权保护条例》第二十二条之规定,若资源存在侵权或相关问题请联系本站客服人员,zhiweidada#qq.com,请把#换成@,本站将给予最大的支持与配合,做到及时反馈和处理。关于更多版权及免责申明参见 版权及免责申明