使用光线调谐优化的双 DQN 算法
2022-05-11 09:04:17 81KB python 算法 源码软件 开发语言
Tensorflow 2 Keras的深度强化学习 注意:需要tensorflow == 2.1.0 它是什么? keras-rl2在Python中实现了一些最先进的深度强化学习算法,并与深度学习库无缝集成。 此外, keras-rl2可以与一起使用。 这意味着评估和使用不同算法很容易。 当然,您可以根据自己的需要扩展keras-rl2 。 您可以使用内置的Keras回调和指标或定义自己的指标。 更重要的是,只需扩展一些简单的抽象类,即可轻松实现自己的环境甚至算法。 文档可。 包含什么? 截止到今天,已经实现了以下算法: 深度Q学习(DQN) [1] , [2] Double DQN [3] 深度确定性策略梯度(DDPG) [4] 连续DQN(CDQN或NAF) [6] 交叉熵方法(CEM) [7] , [8] 决斗网络DQN(Dueling DQN) [9] 深层S
2022-04-23 11:05:32 898KB algorithms deep-reinforcement-learning deep dqn
1
基于Jupyter Notebook与python的深度强化学习算法Double DQN Solution
2022-04-17 09:07:36 21KB python jupyter 算法 开发语言
不用强化学习工具箱的DQN算法案例与matlab代码,方便大家学习使用。可以在此基础上直接更改编写自己的项目
2022-04-06 03:12:11 872KB matlab 算法 学习 DQN
本项目采用MATLAB语言搭建cartPole问题环境以及手动实现DQN算法能够很好的解决控制小车的平衡一类问题,其目的是帮助初学者很好地理解DQN算法。
2022-04-06 03:10:36 4KB matlab 算法 开发语言 强化学习
代码中包含13种强化学习算法,所调用的环境不仅包含gym下面的一些简单环境,还可以自己设计环境(简单的迷宫游戏),简洁明了,适合算法学习的同学使用,其中A3C与PPO还涉及了并行运算的算法。
2022-03-30 18:59:56 3.23MB DQN PPO DDPG TRPO
1
my_PDQN:我的纸张Parameterized-DQN代码
2022-03-19 19:43:35 5KB Python
1
TensorFlow中的深度强化学习 TensorFlow实施深度强化学习论文。 该实现包含: [1] [2][3][4][5](进行中) [6](正在进行中) [7](进行中) [8](正在进行中) 要求 Python 2.7 或 用法 首先,使用以下命令安装必备组件: $ pip install -U 'gym[all]' tqdm scipy 不要忘了还要安装最新的 。 还请注意,您需要安装所需的依赖项gym[all] 在没有gpu的情况下使用所述的DQN模型进行训练: $ python main.py --network_header_type=nips --env_na
1
PyRL-Pytorch中的强化学习框架 PyRL是深度强化学习研究的框架。 在PyTorch中实现了以下算法: (在制品) (WIP) (在制品) 该项目仍在积极开发中。 特征 模块化架构 在PyTorch中实现 可读代码 安装 git clone https://github.com/chaovven/pyrl.git pip3 install -r requirements.txt 我强烈建议使用conda环境进行实验。 其中一些示例使用MuJoCo物理模拟器。 有关设置MuJoCo的说明,请参见。 进行实验 示例1: TD3 python3 main.py --alg=td3 with env=InvertedPendulum-v2 默认参数存储在config/default.yaml ,其中所有实验都共享这些参数。 TD3的参数存储在文件config/algs
1
turtlebot3强化学习避障,包括DQN, DDPG,PPO,SAC。 转载地址 https://github.com/Crawford-fang/ROS_pytorch_RL/tree/main/DQN 我就用过DQN,里面有很多需要修改的地方。主要是包括路径的代码,改成自己的路径。还有神经网络输入数量有错,需要和雷达接收到的数据维度一致。还有存储空间有错,大小应该为两倍输入数据的大小加上奖励数据和动作数据的大小。代码可用于其他环境和雷达小车
2022-03-10 20:34:34 358KB ROS DQN 深度强化学习 避障
1