基于python的深度强化学习算法Deep Q Learning实现
2022-04-17 09:07:36 16KB python 算法 深度学习 开发语言
Deep Learning(深度学习)学习笔记整理.pdf.zip
2022-04-15 18:12:57 1.75MB 深度学习 学习 机器学习 人工智能
深度学习:学习率规划-余弦退火CosineAnnealing和WarmRestart原理及实现 深度学习原理.pdf
2022-04-15 13:17:28 1.21MB 深度学习 学习 人工智能
深度强化学习求解动态柔性作业车间调度问题
matlab调整代码大小写描述 这是一种算法,它通过与跨度边界交替优化来调整深层多内核网络。 这是尝试将深度学习扩展到较小的样本量。 该算法在Strobl EV(Visweswaran S.深度多核学习)中进行了详细描述。 ICMLA,2013年。 代码 首先,请安装MATLAB版本的LIBSVM()。 然后,下载此处上传的整个软件包(包括实用程序功能)。 主要方法 deepMKL_train.m-训练网络。 每层都有一个RBF,poly2,poly3和线性核。 如果跨度增加,则学习率可能会太高。 默认值在许多情况下都适用,但是可能需要进行一些调整。 deepMKL_test.m-测试网络
2022-04-07 15:22:35 37KB 系统开源
1
RL图 用于深度强化学习的模块化计算图。 RLgraph是一个在研究和实践中快速原型化,定义和执行强化学习算法的框架。 RLgraph与大多数其他库不同,因为它可以支持TensorFlow(或通常的静态图),也可以通过单个组件接口支持急切/按运行定义执行(PyTorch)。 您还可以在此处找到介绍性博文: 。 RLgraph公开了使用代理的良好定义的API,并提供了用于测试和组装机器学习模型的新颖组件概念。 通过分离图定义,编译和执行,无需修改代理定义即可访问多个分布式后端和设备执行策略。 这意味着它特别适合从应用用例原型到大规模分布式培训的平稳过渡。 版本0.4.0中RLgraph的
1
通过深度强化学习实现基于单眼视觉的避障 由,,尼基trigoni,安德鲁·马卡姆。 本文的张量流实现: 内容 介绍 该存储库包含: 1.Training代码。 我们编写自己的培训代码,但直接使用提供的代码构建模式。 (我们在存储库中保留了Iro的许可证) 2.用于训练FCRN的数据预处理代码。 3.在Gazebo模拟器中使用turtlebot2进行D3QN(具有决斗架构的Double Deep Q网络)的训练代码。 4,在现实世界中使用turtlebot2测试D3QN的代码 5,tensorflow和ros之间的接口代码 D3QN的网络模型与本文稍有不同,因为我们发现此版本具有更好的性能。 您可以在获得我们真实世界实验的视频 先决条件 Tensorflow> 1.1 ROS动力学 cv2 操作说明 再培训FCRN 我们在/Depth/data文件夹中有一个用turtlebo
2022-04-02 18:14:19 127.61MB Python
1
DRL深度强化学习无人机路径规划程序源码
2022-03-30 17:23:12 50KB 源码
1
在国内,腾讯 AI Lab 也一直致力于 AI+游戏的研究。近日,基于腾讯天美工作室开发的热门 MOBA 类手游《王者荣耀》,腾讯 AI Lab 公布了一项用深度强化学习来为智能体预测游戏动作研究成果。 该论文已被 AAAI 2020 接收。
2022-03-30 09:22:59 3.9MB 深度学习 人工智能 MOBA 王者荣耀
1
d4rl-小球 使用Pybullet环境进行数据驱动的深度强化学习的数据集。 这项工作旨在通过开源项目符号模拟器为数据驱动的深度强化学习提供数据集,从而鼓励更多的人加入该社区。 该存储库建立在。 但是,当前,如果不检查MuJoCo激活密钥就无法导入d4rl,这会使程序失败。 因此, d4rl_pybullet.offline_env是直接从复制的。 安装 $ pip install git+https://github.com/takuseno/d4rl-pybullet 用法 该API与原始d4rl基本相同。 import gym import d4rl_pybullet # dataset will be automatically downloaded into ~/.d4rl/datasets env = gym . make ( 'hopper-bullet-mixed-v0
1