#4.6*_DQN_with_Prioritised_Replay__using_Tensorflow_(强化学习_Reinfo
2021-09-01 21:00:23 32.52MB 学习资源
#4.5*_Double_DQN_using_Tensorflow_(强化学习_Reinforcement_Learning_教
2021-09-01 21:00:22 31.88MB 学习资源
#4.5_DQN_强化学习_(PyTorch_tutorial_神经网络_教学)
2021-09-01 21:00:21 41.78MB 学习资源
#4.3_DQN_思维决策_using_Tensorflow_(强化学习_Reinforcement_Learning_教学)
2021-09-01 21:00:17 52.49MB 学习资源
#4.2_DQN_神经网络_using_Tensorflow_(强化学习_Reinforcement_Learning_教学)
2021-09-01 21:00:15 25.98MB 学习资源
#4.1_DQN_算法更新_using_Tensorflow_(强化学习_Reinforcement_Learning_教学)
2021-09-01 21:00:13 15.67MB 学习资源
DQN-PID强化学习算法, 姿态控制, python程序
2021-08-29 20:03:05 11KB DQN-PID 姿态控制 python
DQN深度强化学习算法, 水下机器人姿态控制, python代码
2021-08-29 20:03:04 10KB DQN python代码 姿态控制
深度强化学习算法 该存储库将使用PyTorch实现经典的深度强化学习算法。 该存储库的目的是为人们提供清晰的代码,以供他们学习深度强化学习算法。 将来,将添加更多算法,并且还将保留现有代码。 当前实施 深度Q学习网络(DQN) 基本DQN 双Q网络 决斗网络架构 深度确定性策略梯度(DDPG) 优势演员评判(A2C) 信任区域策略梯度(TRPO) 近端政策优化(PPO) 使用克罗内克因素信任区域(ACKTR)的演员评论家 软演员评论(SAC) 更新信息 :triangular_flag: 2018年10月17日-在此更新中,大多数算法已得到改进,并添加了更多关于图的实验(DPPG除外)。 PPO现在支持atari游戏和mujoco-env 。 TRPO非常稳定,可以得到更好的结果! :triangular_flag: 2019-07-15-在此更新中,不再需要为openai基准安装。 我在rl__utils模块中集成了有用的功能。 DDPG也重新实现,并支持更多结果。 自述文件已被修改。 代码结构也有微小的调整。 :triangular_flag: 201
2021-08-29 18:54:48 3.92MB algorithm deep-learning atari2600 flappy-bird
1
基于深度强化学习DQN的无人艇避障控制(matlab)无人艇建模,巡逻艇建模,以及DQN代码,详见 https://blog.csdn.net/weixin_39344871/article/details/119346316
2021-08-03 16:05:31 24.47MB 深度强化学习