pytorch-vsumm-reforce 此存储库包含AAAI'18论文的Pytorch实施-。 原始的Theano实现可以在找到。 主要要求是 ( v0.4.0 )和python 2.7 。 和可能未安装在您的计算机中。 请安装其他缺少的依赖项。 开始吧 下载预处理的数据集 git clone https://github.com/KaiyangZhou/pytorch-vsumm-reinforce cd pytorch-vsumm-reinforce # download datasets.tar.gz (173.5MB) wget http://www.eecs.qmul.ac.uk/~kz303/vsumm-reinforce/datasets.tar.gz tar -xvzf datasets.tar.gz 分割 python create_split.py -d da
1
TensorFlow中的深度强化学习 TensorFlow实施深度强化学习论文。 该实现包含: [1] [2][3][4][5](进行中) [6](正在进行中) [7](进行中) [8](正在进行中) 要求 Python 2.7 或 用法 首先,使用以下命令安装必备组件: $ pip install -U 'gym[all]' tqdm scipy 不要忘了还要安装最新的 。 还请注意,您需要安装所需的依赖项gym[all] 在没有gpu的情况下使用所述的DQN模型进行训练: $ python main.py --network_header_type=nips --env_na
1
Master reinforcement learning, a popular area of machine learning, starting with the basics: discover how agents and the environment evolve and then gain a clear picture of how they are inter-related. You’ll then work with theories related to reinforcement learning and see the concepts that build up the reinforcement learning process. Reinforcement Learning discusses algorithm implementations important for reinforcement learning, including Markov’s Decision process and Semi Markov Decision process. The next section shows you how to get started with Open AI before looking at Open AI Gym. You’ll then learn about Swarm Intelligence with Python in terms of reinforcement learning. The last part of the book starts with the TensorFlow environment and gives an outline of how reinforcement learning can be applied to TensorFlow. There’s also coverage of Keras, a framework that can be used with reinforcement learning. Finally, you'll delve into Google’s Deep Mind and see scenarios where reinforcement learning can be used. What You'll Learn Absorb the core concepts of the reinforcement learning process Use advanced topics of deep learning and AI Work with Open AI Gym, Open AI, and Python Harness reinforcement learning with TensorFlow and Keras using Python Who This Book Is For Data scientists, machine learning and deep learning professionals, developers who want to adapt and learn reinforcement learning.
2022-03-18 20:25:15 9.04MB tensorflow keras python
1
Richard S.Sutton和Andrew G.Barto所著。学习强化学习的人都应该知道这两个人。本资料为旁听Rich Sutton课时老师推荐的阅读材料之一,本资料仅限个人使用,分三个压缩包上传。此为第三个
2022-03-17 10:50:41 12.52MB 强化学习 reinforcement learning
1
Richard S.Sutton和Andrew G.Barto所著。学习强化学习的人都应该知道这两个人。本资料为旁听Rich Sutton课时老师推荐的阅读材料之一,本资料仅限个人使用,分三个压缩包上传。此为第二个
2022-03-17 10:15:00 14.31MB 强化学习 reinforcement learning
1
Richard S.Sutton和Andrew G.Barto所著。学习强化学习的人都应该知道这两个人。本资料为旁听Rich Sutton课时老师推荐的阅读材料之一,本资料仅限个人使用,分三个压缩包上传。
2022-03-17 10:09:40 14.31MB 强化学习 reinforcement learning
1
PyRL-Pytorch中的强化学习框架 PyRL是深度强化学习研究的框架。 在PyTorch中实现了以下算法: (在制品) (WIP) (在制品) 该项目仍在积极开发中。 特征 模块化架构 在PyTorch中实现 可读代码 安装 git clone https://github.com/chaovven/pyrl.git pip3 install -r requirements.txt 我强烈建议使用conda环境进行实验。 其中一些示例使用MuJoCo物理模拟器。 有关设置MuJoCo的说明,请参见。 进行实验 示例1: TD3 python3 main.py --alg=td3 with env=InvertedPendulum-v2 默认参数存储在config/default.yaml ,其中所有实验都共享这些参数。 TD3的参数存储在文件config/algs
1
布鲁克林Bang Bang 在学生中进行项目/竞赛的设置,以训练经典游戏Bomberman的获奖强化学习代理。 方法 简单神经网络方法 ( 是基于的代理 罗莎·迪亚兹(Rosa Diaz) 杰克·佩拉尔塔(Jake Peralta) Github动作 培训代理商可能会令人讨厌。为了简化我们的工作,我们集成了一个Github Action来自动培训我们的代理商。可悲的是,我的服务器没有图形卡,因此我们仍然使用CPU进行训练。好吧,我并不富有:D 使用映像运行 : docker run -it --name github-runner \ -e RUNNER_NAME=private \ -e GITHUB_ACCESS_TOKEN=... \ -e RUNNER_TOKEN=... \ -e RUNNER_REPOSITORY_URL=https://gi
1
强化学习导论 第二版 英文版 2017最新版 Reinforcement Learning An Introduction
2022-03-12 16:41:37 12.11MB 强化学习 增强学习
1
CuRL-针对目标机器人控制的课程强化学习 我的MEng在计算(人工智能)最终项目中的代码档案,报告- 。 该项目的主要成果是CuRL-一种用于培训政策以完成面向目标的机器人任务的方法,而最新的深度强化学习则很难解决这些问题。 通过使用简单任务的课程表,我们逐步指导一项政策,使其能够完成所需的完整任务。 上图有助于说明该方法。 我们的目标是训练机器人在避开墙壁的情况下到达目标球体。 从头开始使用强化学习的最新方法将很难学会克服困难。 在项目报告中对此进行了更详细的说明。 通过课程强化学习,我们最初会移除墙壁,并且机器人可以学习沿红色轨迹移动。 通过顺序添加墙的“部分”(用彩色同心圆表示),我们可以指导策略,以便机器人学习遵循所需的绿色轨迹。 本文介绍的最终方法及其早期版本需要对RL算法的基线实现进行重大更改,尤其是为了支持残余策略培训。 我希望这里提供的代码可以帮助其他从事类似项目
1