强化学习必读论文
2021-10-23 22:42:26 13.6MB DQN
1
包括DP, MC, TD, TD-lambda, DQN, PG, AC, A3C, DDPG, Dyna_Q, Bandit, AlphaGoBangZero以及部分仿真游戏源码
2021-10-14 16:17:05 32.58MB 强化学习
1
用keras搭建DQN网络,实现走迷宫
2021-10-13 18:04:09 13KB 强化学习 迷宫 DQN
1
金融投资组合选择和自动交易中的Q学习 Policy Gradient和Q-Learning是强化学习(机器学习的一个分支)中的技术,而后者由于在视频游戏和与人类专家进行的Game of Go比赛中的胜利而具有较高的知名度。 但是,由于问题学习中连续的行动空间,强化学习在金融投资组合管理问题上的成功应用以前大多限于“策略梯度”变体。 在这个项目中,我们将采用一种简单的离散化方案,以使问题适合于不连续的Q学习技术。 然后,将通过其在其他更成熟的方法上的性能来检验这种方法的有效性。 可能的方法 使用 使用 使用 从零开始的代码 ...
2021-10-11 17:03:40 2.08MB Python
1
keras搭建DQN,构建FlappyBird智能体的模型,分别训练200轮以及github上下载的292轮模型
2021-09-30 17:05:25 21.23MB keras
1
这本书详细介绍了强化学习的常用算法以及算法原理,从蒙特卡罗方法到Q_learning最终到DQN
2021-09-28 19:29:44 1.51MB 强化学习 深度学习
1
可读,可重用,可扩展 Machin是为pytorch设计的增强库。 支持的型号 任何事物,包括循环网络。 支持的算法 当前,Machin已实现以下算法,该列表仍在增长: 单代理算法: 多主体算法: 大规模并行算法: 增强功能: 支持的算法: 进化策略 基于模型的方法 特征 1.可读 与其他强化学习库(例如著名的 , 和。 Machin尝试仅提供RL算法的简单明了的实现。 Machin中的所有算法均以最小的抽象设计,并具有非常详细的文档以及各种有用的教程。 2.可重复使用 Machin采用与pytorch类似的方法,将算法和数据结构封装在自己的类中。 用户无需设置一系列data collectors , trainers , runners , samplers ...即可使用它们,只需导入即可。 模型上的唯一限制是它们的输入/输出格式,但是,这些限制很小,可以轻松地使算法适
2021-09-17 19:09:16 1.54MB python reinforcement-learning deep-learning gae
1
强化学习 深度学习:优化 创建人:Vithurshan Vijayachandran和Hisho Rajanathan RLearning_NOTEBOOK.ipynb-适用于基本(Q学习)和高级任务(DQN和DDQN)的Jupyter笔记本。 RL_Rport.pdf:报告所有研究结果和评估。 使用以下预训练模型来测试网络,因为重新训练非常耗时。 DQNTrainingModel.h5-测试DQN网络所需的文件 DDQNTrainingModel.h5-测试DDQN网络所需的文件 DDQNPERTrainingModel.h5 =使用PER网络测试DDQN所需的文件
2021-09-14 10:57:27 2.5MB JupyterNotebook
1
通过DQN的模型,实现机器学习,并且进行统计。练手的DEMO。
2021-09-07 21:57:12 4KB python 机器学习
1
#4.7*_Dueling_DQN_using_Tensorflow_(强化学习_Reinforcement_Learning_
2021-09-01 21:00:23 16.83MB 学习资源