【《深度强化学习实战》随书代码】’Code from the Deep Reinforcement Learning in Action book from Manning, Inc'
2022-04-23 20:30:56 427KB 强化学习 Deep R 深度强化学习
1
基于Jupyter Notebook与python的深度强化学习算法Deep Q Learning
2022-04-17 09:07:37 20KB python jupyter 算法 深度学习
基于Jupyter Notebook与python的深度强化学习算法Double DQN Solution
2022-04-17 09:07:36 21KB python jupyter 算法 开发语言
基于python的深度强化学习算法Deep Q Learning实现
2022-04-17 09:07:36 16KB python 算法 深度学习 开发语言
深度强化学习求解动态柔性作业车间调度问题
RL图 用于深度强化学习的模块化计算图。 RLgraph是一个在研究和实践中快速原型化,定义和执行强化学习算法的框架。 RLgraph与大多数其他库不同,因为它可以支持TensorFlow(或通常的静态图),也可以通过单个组件接口支持急切/按运行定义执行(PyTorch)。 您还可以在此处找到介绍性博文: 。 RLgraph公开了使用代理的良好定义的API,并提供了用于测试和组装机器学习模型的新颖组件概念。 通过分离图定义,编译和执行,无需修改代理定义即可访问多个分布式后端和设备执行策略。 这意味着它特别适合从应用用例原型到大规模分布式培训的平稳过渡。 版本0.4.0中RLgraph的
1
通过深度强化学习实现基于单眼视觉的避障 由,,尼基trigoni,安德鲁·马卡姆。 本文的张量流实现: 内容 介绍 该存储库包含: 1.Training代码。 我们编写自己的培训代码,但直接使用提供的代码构建模式。 (我们在存储库中保留了Iro的许可证) 2.用于训练FCRN的数据预处理代码。 3.在Gazebo模拟器中使用turtlebot2进行D3QN(具有决斗架构的Double Deep Q网络)的训练代码。 4,在现实世界中使用turtlebot2测试D3QN的代码 5,tensorflow和ros之间的接口代码 D3QN的网络模型与本文稍有不同,因为我们发现此版本具有更好的性能。 您可以在获得我们真实世界实验的视频 先决条件 Tensorflow> 1.1 ROS动力学 cv2 操作说明 再培训FCRN 我们在/Depth/data文件夹中有一个用turtlebo
2022-04-02 18:14:19 127.61MB Python
1
DRL深度强化学习无人机路径规划程序源码
2022-03-30 17:23:12 50KB 源码
1
在国内,腾讯 AI Lab 也一直致力于 AI+游戏的研究。近日,基于腾讯天美工作室开发的热门 MOBA 类手游《王者荣耀》,腾讯 AI Lab 公布了一项用深度强化学习来为智能体预测游戏动作研究成果。 该论文已被 AAAI 2020 接收。
2022-03-30 09:22:59 3.9MB 深度学习 人工智能 MOBA 王者荣耀
1