DeepRL_PyTorch：用于研究的深度强化学习代码。当前，仅存在算法代码：DQN，C51，QR-DQN，IQN和QUOTA-源码

algorithm reinforcement-learning algorithms pytorch

深度强化学习代码当前，这里只有用于分布增强学习的代码。 C51，QR-DQN和IQN的代码与略有。 QUOTA是基于算法作者同的工作而实现的。我最近注意到，我的DQN代码可能无法获得理想的性能，而其他代码却运行良好。如果有人可以指出我的代码中的错误，我将不胜感激。随时进行聊天-如果您想讨论任何事情，请给我发送电子邮件。依赖关系： pytorch（> = 1.0.0）体育馆（= 0.10.9）麻木 matplotlib 用法：为了运行我的代码，您需要在主目录下创建两个子目录：./data/model/＆./data/plots/。这两个目录用于存储数据。当计算机的python环境满足上述依赖性时，您可以运行代码。例如，输入： python 3_ iqn . py Breakout 在命令行上运行以在Atari环境中运行算法。您可以为代码内的算法更改一些特定参数。训练后，您可以通过使用适当的参数运行result_show.py来绘制结果。参考文献：通过深度强化学习（DQN）进行人为控制[] [] 强化学习的分布式视角（C51）[] []

文件下载

评论信息

其他资源

免责申明

【只为小站】的资源来自网友分享，仅供学习研究，请务必在下载后24小时内给予删除，不得用于其他任何用途，否则后果自负。基于互联网的特殊性，【只为小站】无法对用户传输的作品、信息、内容的权属或合法性、合规性、真实性、科学性、完整权、有效性等进行实质审查；无论【只为小站】经营者是否已进行审查，用户均应自行承担因其传输的作品、信息、内容而可能或已经产生的侵权或权属纠纷等法律责任。
本站所有资源不代表本站的观点或立场，基于网友分享，根据中国法律《信息网络传播权保护条例》第二十二条之规定，若资源存在侵权或相关问题请联系本站客服人员，zhiweidada#qq.com，请把#换成@，本站将给予最大的支持与配合，做到及时反馈和处理。关于更多版权及免责申明参见版权及免责申明

DeepRL_PyTorch：用于研究的深度强化学习代码。 当前，仅存在算法代码：DQN，C51，QR-DQN，IQN和QUOTA-源码

文件下载

评论信息

其他资源

免责申明

个人信息

相关资源标签

热门下载

最新下载

DeepRL_PyTorch：用于研究的深度强化学习代码。当前，仅存在算法代码：DQN，C51，QR-DQN，IQN和QUOTA-源码