分布式DRL 分布式深度强化学习 该框架的灵感来自OpenAI的通用RL培训系统Rapid 。 快速框架: 我们的框架: 教程 该框架将强化学习过程分为五个部分: 重播缓冲区(选项) 参数服务器 火车(学习) 推出 测试 @ ray . remote class ReplayBuffer : ... # replay buffer @ ray . remote class ParameterServer ( object ): ... # keep the newest network weights here # could pull and push the weights # also could save the weights to local @ ray . remote ( num_gpus = 1 ,
2021-09-18 15:12:57 874KB Python
1
一种基于分布式强化学习的多智能体协调方法,通过协商协调合作完成复杂的控制任务。
2021-09-18 15:10:40 568KB 多智体
1
资源包含《Reinforcement Learning: An Introduction》两个版本英文pdf/chm电子书和部分翻译资料。
2021-09-17 21:37:15 59.73MB 强化学习 RL Sutton 教程
1
清清华大学自动化系的教材《最优控制》,很好
2021-09-17 20:31:25 7.99MB 最优控制
1
可读,可重用,可扩展 Machin是为pytorch设计的增强库。 支持的型号 任何事物,包括循环网络。 支持的算法 当前,Machin已实现以下算法,该列表仍在增长: 单代理算法: 多主体算法: 大规模并行算法: 增强功能: 支持的算法: 进化策略 基于模型的方法 特征 1.可读 与其他强化学习库(例如著名的 , 和。 Machin尝试仅提供RL算法的简单明了的实现。 Machin中的所有算法均以最小的抽象设计,并具有非常详细的文档以及各种有用的教程。 2.可重复使用 Machin采用与pytorch类似的方法,将算法和数据结构封装在自己的类中。 用户无需设置一系列data collectors , trainers , runners , samplers ...即可使用它们,只需导入即可。 模型上的唯一限制是它们的输入/输出格式,但是,这些限制很小,可以轻松地使算法适
2021-09-17 19:09:16 1.54MB python reinforcement-learning deep-learning gae
1
随机清洁机器人的基于模型的值迭代算法。 这段代码是值迭代算法的一个非常简单的实现,对于强化学习和动态规划领域的初学者来说,它是一个有用的起点。 随机清洁机器人 MDP:清洁机器人必须收集用过的罐子,还必须为电池充电。 状态描述了机器人的位置,动作描述了运动的方向。 机器人可以向左或向右移动。 第一个 (0) 和最后 (5) 个状态是终止状态。 目标是找到一个最优策略,使任何初始状态的回报最大化。 这里是 Q-iteration(基于模型的值迭代 DP)。 参考:算法 2-2,来自: @book{busoniu2010reinforcement, title={使用函数逼近器的强化学习和动态规划}, 作者={Busoniu,Lucian 和 Babuska,Robert 和 De Schutter,Bart 和 Ernst,Damien}, 年={2010}, 出版商={CRC Press}
2021-09-17 17:03:41 3KB matlab
1
学习+彭伟《揭秘深度强化学习》PDF+源代码+资料-附件资源
2021-09-17 17:00:05 23B
1
an introduction to reinforcement learning by Sutton 稳定稿哈哈哈哈哈哈哈哈
2021-09-16 16:55:39 49.14MB Sutton 强化学习
1
交易对 使用MATLAB代码生成结果和图表中的结果“具有绝对和相对库存惩罚的对交易策略的随机最优控制”( ) 要运行的主要脚本是main_script.m
2021-09-16 16:39:27 16KB MATLAB
1
TensorFlow2中的深度强化学习 是一个使用实现各种流行的深度强化学习算法的存储库。 该存储库的关键是易于理解的代码。 因此,如果您是学生或研究深度强化学习的研究人员,我认为这是使用此存储库学习的最佳选择。 一种算法仅依赖于一个python脚本文件。 因此,您不必进出不同的文件即可研究特定的算法。 该存储库将不断更新,并将继续添加新的“深度强化学习”算法。 演算法 DQN 纸上 作者Volodymyr Mnih,Koray Kavukcuoglu,David Silver,Alex Graves,Ioannis Antonoglou,Daan Wierstra,Martin Rie
1