强化学习 强化学习的学习代码,算法包括Q-Learning、DQN、DDQN、PolicyGradient、ActorCritic、DDPG、PPO、TD3、SAC。 使用说明 python版本: 3.10.13 依赖库:requirements.txt 安装依赖库:pip install -r requirements.txt -i https://pypi.tuna.tsinghua.edu.cn/simple/
2024-03-12 21:16:32 53.97MB
1
利用simulink中自带的深度强化学习包中的DQN算法优化
2022-11-04 12:04:49 567KB simulink 深度学习 强化学习
1
深度Q学习 在OpenAI Gym上测试了具有基本或双重q-learning训练算法的深度q-networn,对决q-network的实现。 先决条件 该项目是使用Python 3.5和Tensorflow(通过tensorflow-gpu 1.2.1测试)实现的。 可用的环境来自OpenAi Gym。 要安装健身房,请访问 。 要工作需要来自atari_wrappers.py 训练网络 使用train.py模块执行网络培训。 它要求将要学习的体育馆环境作为参数。 可选地,可以指定要使用的网络类型和学习算法。 可以使用--checkpoint参数提供网络权重,使用--training_info参数提供培训状态(例如,当前步骤,总步骤,体验重播缓冲区数据)从检查点重新开始培训。 通过使用--checkpoint_step,可以指定保存检查点的步骤数。 python train.py --
2022-09-04 11:47:40 9KB Python
1
深度学习 通过深度强化学习制作简单的游戏AI简介 Keras和Gym中最小和简单的深度Q学习实现。 不到100行代码! 博客文章包含dqn.py代码的说明。 为了方便起见,我对该存储库进行了一些细微的调整,例如load和save功能。 我还使memory成为双端队列,而不只是列表。 这是为了限制内存中元素的最大数量。 训练对于dqn.py可能是不稳定的。 ddqn.py减轻了此问题。 我将在下一篇文章中介绍ddqn
1
使用Pytorch和多项式分布采样实现DDQN算法 DDQN和Nature DQN一样,也有一样的两个Q网络结构。在Nature DQN的基础上,通过解耦目标Q值动作的选择和目标Q值的计算这两步,来消除过度估计的问题。
2021-10-28 10:11:39 49KB Pytorch DDQN 深度强化学习
1
AirSim PyTorch无人机DDQN代理
2021-09-25 20:34:28 30KB Python
1
强化学习 深度学习:优化 创建人:Vithurshan Vijayachandran和Hisho Rajanathan RLearning_NOTEBOOK.ipynb-适用于基本(Q学习)和高级任务(DQN和DDQN)的Jupyter笔记本。 RL_Rport.pdf:报告所有研究结果和评估。 使用以下预训练模型来测试网络,因为重新训练非常耗时。 DQNTrainingModel.h5-测试DQN网络所需的文件 DDQNTrainingModel.h5-测试DDQN网络所需的文件 DDQNPERTrainingModel.h5 =使用PER网络测试DDQN所需的文件
2021-09-14 10:57:27 2.5MB JupyterNotebook
1
深度强化学习算法 该存储库将使用PyTorch实现经典的深度强化学习算法。 该存储库的目的是为人们提供清晰的代码,以供他们学习深度强化学习算法。 将来,将添加更多算法,并且还将保留现有代码。 当前实施 深度Q学习网络(DQN) 基本DQN 双Q网络 决斗网络架构 深度确定性策略梯度(DDPG) 优势演员评判(A2C) 信任区域策略梯度(TRPO) 近端政策优化(PPO) 使用克罗内克因素信任区域(ACKTR)的演员评论家 软演员评论(SAC) 更新信息 :triangular_flag: 2018年10月17日-在此更新中,大多数算法已得到改进,并添加了更多关于图的实验(DPPG除外)。 PPO现在支持atari游戏和mujoco-env 。 TRPO非常稳定,可以得到更好的结果! :triangular_flag: 2019-07-15-在此更新中,不再需要为openai基准安装。 我在rl__utils模块中集成了有用的功能。 DDPG也重新实现,并支持更多结果。 自述文件已被修改。 代码结构也有微小的调整。 :triangular_flag: 201
2021-08-29 18:54:48 3.92MB algorithm deep-learning atari2600 flappy-bird
1