基于Jupyter Notebook与python的深度强化学习算法Double DQN Solution
2022-04-17 09:07:36 21KB python jupyter 算法 开发语言
不用强化学习工具箱的DQN算法案例与matlab代码,方便大家学习使用。可以在此基础上直接更改编写自己的项目
2022-04-06 03:12:11 872KB matlab 算法 学习 DQN
本项目采用MATLAB语言搭建cartPole问题环境以及手动实现DQN算法能够很好的解决控制小车的平衡一类问题,其目的是帮助初学者很好地理解DQN算法。
2022-04-06 03:10:36 4KB matlab 算法 开发语言 强化学习
代码中包含13种强化学习算法,所调用的环境不仅包含gym下面的一些简单环境,还可以自己设计环境(简单的迷宫游戏),简洁明了,适合算法学习的同学使用,其中A3C与PPO还涉及了并行运算的算法。
2022-03-30 18:59:56 3.23MB DQN PPO DDPG TRPO
1
my_PDQN:我的纸张Parameterized-DQN代码
2022-03-19 19:43:35 5KB Python
1
TensorFlow中的深度强化学习 TensorFlow实施深度强化学习论文。 该实现包含: [1] [2][3][4][5](进行中) [6](正在进行中) [7](进行中) [8](正在进行中) 要求 Python 2.7 或 用法 首先,使用以下命令安装必备组件: $ pip install -U 'gym[all]' tqdm scipy 不要忘了还要安装最新的 。 还请注意,您需要安装所需的依赖项gym[all] 在没有gpu的情况下使用所述的DQN模型进行训练: $ python main.py --network_header_type=nips --env_na
1
PyRL-Pytorch中的强化学习框架 PyRL是深度强化学习研究的框架。 在PyTorch中实现了以下算法: (在制品) (WIP) (在制品) 该项目仍在积极开发中。 特征 模块化架构 在PyTorch中实现 可读代码 安装 git clone https://github.com/chaovven/pyrl.git pip3 install -r requirements.txt 我强烈建议使用conda环境进行实验。 其中一些示例使用MuJoCo物理模拟器。 有关设置MuJoCo的说明,请参见。 进行实验 示例1: TD3 python3 main.py --alg=td3 with env=InvertedPendulum-v2 默认参数存储在config/default.yaml ,其中所有实验都共享这些参数。 TD3的参数存储在文件config/algs
1
turtlebot3强化学习避障,包括DQN, DDPG,PPO,SAC。 转载地址 https://github.com/Crawford-fang/ROS_pytorch_RL/tree/main/DQN 我就用过DQN,里面有很多需要修改的地方。主要是包括路径的代码,改成自己的路径。还有神经网络输入数量有错,需要和雷达接收到的数据维度一致。还有存储空间有错,大小应该为两倍输入数据的大小加上奖励数据和动作数据的大小。代码可用于其他环境和雷达小车
2022-03-10 20:34:34 358KB ROS DQN 深度强化学习 避障
1
DoubleDQN_turtlebot2 基于ROS的TurtleBot 2机器人的双重DQN实现 这是Turtlebot 2机器人上Double DQN算法的实现。 Python解释器:Python 3.6 ROS版本:ROS Melodic凉亭:凉亭9您还需要安装openai_ros ROS软件包( ),以访问基于开放AI的环境和用于训练机器人的命令。 您可以按照ROS的本教程进行设置: ://wiki.ros.org/openai_ros/TurtleBot2 with openai_ros安装在TurtleBot机器人顶部的激光扫描仪用于训练机器人,并且也可以扩展它仅对相机图像进行了微小的更改,但是,我不会在此代码中显示出来。 下面是您将需要的python软件包列表(通过conda列表生成),我建议使用这些库创建一个Conda环境,以实现平稳运行。 _libgcc
2022-03-03 21:33:05 1KB
1
Playing Flappy Bird Using Deep Reinforcement Learning (Based on Deep Q Learning DQN)
2022-03-01 20:37:09 12.23MB 强化学习 DQN Flappy Bird
1