RL图 用于深度强化学习的模块化计算图。 RLgraph是一个在研究和实践中快速原型化,定义和执行强化学习算法的框架。 RLgraph与大多数其他库不同,因为它可以支持TensorFlow(或通常的静态图),也可以通过单个组件接口支持急切/按运行定义执行(PyTorch)。 您还可以在此处找到介绍性博文: 。 RLgraph公开了使用代理的良好定义的API,并提供了用于测试和组装机器学习模型的新颖组件概念。 通过分离图定义,编译和执行,无需修改代理定义即可访问多个分布式后端和设备执行策略。 这意味着它特别适合从应用用例原型到大规模分布式培训的平稳过渡。 版本0.4.0中RLgraph的
1
MuJoCo的RL 该软件包包含用于用模拟的连续控制任务的各种RL算法的实现 安装 主要的软件包依赖项是MuJoCo , python=3.7 , gym>=0.13 , mujoco-py>=2.0和pytorch>=1.0 。 有关详细的安装说明,请参阅setup/README.md ()。 参考书目 如果您觉得该包装有用,请引用以下文件。 @INPROCEEDINGS{Rajeswaran-NIPS-17, AUTHOR = {Aravind Rajeswaran and Kendall Lowrey and Emanuel Todorov and Sham Kakade}, TITLE = "{Towards Generalization and Simplicity in Continuous Control}", BOOKTITLE =
1
d4rl-小球 使用Pybullet环境进行数据驱动的深度强化学习的数据集。 这项工作旨在通过开源项目符号模拟器为数据驱动的深度强化学习提供数据集,从而鼓励更多的人加入该社区。 该存储库建立在。 但是,当前,如果不检查MuJoCo激活密钥就无法导入d4rl,这会使程序失败。 因此, d4rl_pybullet.offline_env是直接从复制的。 安装 $ pip install git+https://github.com/takuseno/d4rl-pybullet 用法 该API与原始d4rl基本相同。 import gym import d4rl_pybullet # dataset will be automatically downloaded into ~/.d4rl/datasets env = gym . make ( 'hopper-bullet-mixed-v0
1
pytorch-vsumm-reforce 此存储库包含AAAI'18论文的Pytorch实施-。 原始的Theano实现可以在找到。 主要要求是 ( v0.4.0 )和python 2.7 。 和可能未安装在您的计算机中。 请安装其他缺少的依赖项。 开始吧 下载预处理的数据集 git clone https://github.com/KaiyangZhou/pytorch-vsumm-reinforce cd pytorch-vsumm-reinforce # download datasets.tar.gz (173.5MB) wget http://www.eecs.qmul.ac.uk/~kz303/vsumm-reinforce/datasets.tar.gz tar -xvzf datasets.tar.gz 分割 python create_split.py -d da
1
TensorFlow中的深度强化学习 TensorFlow实施深度强化学习论文。 该实现包含: [1] [2][3][4][5](进行中) [6](正在进行中) [7](进行中) [8](正在进行中) 要求 Python 2.7 或 用法 首先,使用以下命令安装必备组件: $ pip install -U 'gym[all]' tqdm scipy 不要忘了还要安装最新的 。 还请注意,您需要安装所需的依赖项gym[all] 在没有gpu的情况下使用所述的DQN模型进行训练: $ python main.py --network_header_type=nips --env_na
1
Master reinforcement learning, a popular area of machine learning, starting with the basics: discover how agents and the environment evolve and then gain a clear picture of how they are inter-related. You’ll then work with theories related to reinforcement learning and see the concepts that build up the reinforcement learning process. Reinforcement Learning discusses algorithm implementations important for reinforcement learning, including Markov’s Decision process and Semi Markov Decision process. The next section shows you how to get started with Open AI before looking at Open AI Gym. You’ll then learn about Swarm Intelligence with Python in terms of reinforcement learning. The last part of the book starts with the TensorFlow environment and gives an outline of how reinforcement learning can be applied to TensorFlow. There’s also coverage of Keras, a framework that can be used with reinforcement learning. Finally, you'll delve into Google’s Deep Mind and see scenarios where reinforcement learning can be used. What You'll Learn Absorb the core concepts of the reinforcement learning process Use advanced topics of deep learning and AI Work with Open AI Gym, Open AI, and Python Harness reinforcement learning with TensorFlow and Keras using Python Who This Book Is For Data scientists, machine learning and deep learning professionals, developers who want to adapt and learn reinforcement learning.
2022-03-18 20:25:15 9.04MB tensorflow keras python
1
Richard S.Sutton和Andrew G.Barto所著。学习强化学习的人都应该知道这两个人。本资料为旁听Rich Sutton课时老师推荐的阅读材料之一,本资料仅限个人使用,分三个压缩包上传。此为第三个
2022-03-17 10:50:41 12.52MB 强化学习 reinforcement learning
1
Richard S.Sutton和Andrew G.Barto所著。学习强化学习的人都应该知道这两个人。本资料为旁听Rich Sutton课时老师推荐的阅读材料之一,本资料仅限个人使用,分三个压缩包上传。此为第二个
2022-03-17 10:15:00 14.31MB 强化学习 reinforcement learning
1
Richard S.Sutton和Andrew G.Barto所著。学习强化学习的人都应该知道这两个人。本资料为旁听Rich Sutton课时老师推荐的阅读材料之一,本资料仅限个人使用,分三个压缩包上传。
2022-03-17 10:09:40 14.31MB 强化学习 reinforcement learning
1
提出了一种基于RBF网络和启发式Q学习的改进,更强大的RNH-QL方法,用于在较大状态空间中进行路径搜索。 首先,如果增加了给定问题的状态空间并且缺少关于环境的先验信息,则解决了强化学习效率低下的问题。 其次,作为权重更新规则的RBF网络,奖励整形可以在某些中间状态下向代理提供额外的反馈,这将有助于以更可控的方式将代理引导至目标状态。 同时,通过Q学习的过程,底层动态知识可以访问它,而不需要上层RBF网络的背景知识。 第三,结合贪婪开发策略训练神经网络,提高了学习效率,实验结果证明了这一点。
1