RL图 用于深度强化学习的模块化计算图。 RLgraph是一个在研究和实践中快速原型化,定义和执行强化学习算法的框架。 RLgraph与大多数其他库不同,因为它可以支持TensorFlow(或通常的静态图),也可以通过单个组件接口支持急切/按运行定义执行(PyTorch)。 您还可以在此处找到介绍性博文: 。 RLgraph公开了使用代理的良好定义的API,并提供了用于测试和组装机器学习模型的新颖组件概念。 通过分离图定义,编译和执行,无需修改代理定义即可访问多个分布式后端和设备执行策略。 这意味着它特别适合从应用用例原型到大规模分布式培训的平稳过渡。 版本0.4.0中RLgraph的
1
通过深度强化学习实现基于单眼视觉的避障 由,,尼基trigoni,安德鲁·马卡姆。 本文的张量流实现: 内容 介绍 该存储库包含: 1.Training代码。 我们编写自己的培训代码,但直接使用提供的代码构建模式。 (我们在存储库中保留了Iro的许可证) 2.用于训练FCRN的数据预处理代码。 3.在Gazebo模拟器中使用turtlebot2进行D3QN(具有决斗架构的Double Deep Q网络)的训练代码。 4,在现实世界中使用turtlebot2测试D3QN的代码 5,tensorflow和ros之间的接口代码 D3QN的网络模型与本文稍有不同,因为我们发现此版本具有更好的性能。 您可以在获得我们真实世界实验的视频 先决条件 Tensorflow> 1.1 ROS动力学 cv2 操作说明 再培训FCRN 我们在/Depth/data文件夹中有一个用turtlebo
2022-04-02 18:14:19 127.61MB Python
1
DRL深度强化学习无人机路径规划程序源码
2022-03-30 17:23:12 50KB 源码
1
在国内,腾讯 AI Lab 也一直致力于 AI+游戏的研究。近日,基于腾讯天美工作室开发的热门 MOBA 类手游《王者荣耀》,腾讯 AI Lab 公布了一项用深度强化学习来为智能体预测游戏动作研究成果。 该论文已被 AAAI 2020 接收。
2022-03-30 09:22:59 3.9MB 深度学习 人工智能 MOBA 王者荣耀
1
d4rl-小球 使用Pybullet环境进行数据驱动的深度强化学习的数据集。 这项工作旨在通过开源项目符号模拟器为数据驱动的深度强化学习提供数据集,从而鼓励更多的人加入该社区。 该存储库建立在。 但是,当前,如果不检查MuJoCo激活密钥就无法导入d4rl,这会使程序失败。 因此, d4rl_pybullet.offline_env是直接从复制的。 安装 $ pip install git+https://github.com/takuseno/d4rl-pybullet 用法 该API与原始d4rl基本相同。 import gym import d4rl_pybullet # dataset will be automatically downloaded into ~/.d4rl/datasets env = gym . make ( 'hopper-bullet-mixed-v0
1
蛇艾 当前的项目是游戏Snake的深度强化学习的实现。 范围是显示AI蛇如何学会自己玩游戏。 项目结构 该代码分为以下软件包: game_src :实际游戏的源代码 snake_nn :深度学习实现的源代码 saved_models :训练后保存模型的文件夹。 演示模型包含在此文件夹中 为了清楚起见,存在三个不同的主文件,一个相互独立。 即使这重复了代码,也可以更好地用于项目演示。 每个文件可以单独执行。 main.py-手动播放模式。 它加载游戏并允许用户玩游戏。 main_ai_train.py-为蛇执行训练算法并保存输出模型。 main_ai_replay.py-加载模型并使用模型中的神经网络运行游戏。 项目执行 克隆当前的git仓库。 在执行之前,请确保安装所有来自requirements.txt的依赖项。 pip install -r requirements.txt
2022-03-28 09:08:22 1.44MB Python
1
the option-critic architecture中英文PDF,适合HRL学习,PDF清晰。中文翻译较准确,对照英文论文,理解更容易些
2022-03-26 21:10:29 1.01MB 深度强化学习
1
用于定量金融自动股票交易的深度强化学习库FinRL:用于定量金融自动股票交易的深度强化学习库该存储库引用了我们的论文代码,该代码出现在Deep RL Workshop,NeurIPS 2020中。 DRL)已被认为是量化金融的一种有效方法,动手实践经验对初学者很有吸引力。 但是,要训练一个实际的DRL交易代理,该代理决定在哪里进行交易,以什么价格和什么数量进行交易就容易出错。
2022-03-25 22:15:16 7.74MB Python Deep Learning
1
pytorch-vsumm-reforce 此存储库包含AAAI'18论文的Pytorch实施-。 原始的Theano实现可以在找到。 主要要求是 ( v0.4.0 )和python 2.7 。 和可能未安装在您的计算机中。 请安装其他缺少的依赖项。 开始吧 下载预处理的数据集 git clone https://github.com/KaiyangZhou/pytorch-vsumm-reinforce cd pytorch-vsumm-reinforce # download datasets.tar.gz (173.5MB) wget http://www.eecs.qmul.ac.uk/~kz303/vsumm-reinforce/datasets.tar.gz tar -xvzf datasets.tar.gz 分割 python create_split.py -d da
1
TensorFlow中的深度强化学习 TensorFlow实施深度强化学习论文。 该实现包含: [1] [2][3][4][5](进行中) [6](正在进行中) [7](进行中) [8](正在进行中) 要求 Python 2.7 或 用法 首先,使用以下命令安装必备组件: $ pip install -U 'gym[all]' tqdm scipy 不要忘了还要安装最新的 。 还请注意,您需要安装所需的依赖项gym[all] 在没有gpu的情况下使用所述的DQN模型进行训练: $ python main.py --network_header_type=nips --env_na
1