基于Tensorflow实现的PPO算法,依赖库:tensorflow-1.4及以上,gym
2020-01-03 11:16:56 6KB 深度强化学习
1
《揭秘深度强化学习(彭伟)》高清中文版PDF(带目录与书签)
1
深度强化学习的相关教程和代码
2019-12-21 21:40:55 710KB Python开发-机器学习
1
关于DQN的两种版本(使用stop_gradient与不使用stop_gradient) 对不起.....我不知道怎么将文件放到CSDN博客中下载,所以只能放这边了,没有资源分为0的选项.....
2019-12-21 21:28:55 23KB 深度强化学习
1
研究了一段时间的德州扑克,主要针对deepstack的算法进行研究。包括其中的CFR 算法
2019-12-21 21:06:29 1.08MB 深度强化学习
1
深度强化学习DQN训练Flappy Bird源代码,可以直接运行FlappyBirdDQN.py使用。
2019-12-21 20:38:27 106.52MB DL
1
深度强化学习是人工智能领域的一个新的研究热点.它以一种通用的形式将深度学习的感知能力与强化学习的决策能力相结合,并能够通过端对端的学习方式实现从原始输入到输出的直接控制.自提出以来,在许多需要感知高维度原始输入数据和决策控制的任务中,深度强化学习方法已经取得了实质性的突破.该文首先阐述了三类主要的深度强化学习方法,包括基于值函数的深度强化学习、基于策略梯度的深度强化学习和基于搜索与监督的深度强化学习;其次对深度强化学习领域的一些前沿研究方向进行了综述,包括分层深度强化学习、多任务迁移深度强化学习、多智能体深度强化学习、基于记忆与推理的深度强化学习等.最后总结了深度强化学习在若干领域的成功应用和未来发展趋势.
2019-12-21 20:34:34 2.73MB 深度学习 强化学习
1
李宏毅深度强化学习PPT(含机器学习课程对RL的简介)
2019-12-21 20:33:36 159.36MB 深度强化学习 李宏毅
1
深度强化学习是人工智能领域的一个新的研究热点.它以一种通用的形式将深度学习的感知能力与强化学习的决策能力相结合,并能够通过端对端的学习方式实现从原始输入到输出的直接控制.自提出以来,在许多需要感知高维度原始输入数据和决策控制的任务中,深度强化学习方法已经取得了实质性的突破.该文首先阐述了三类主要的深度强化学习方法,包括基于值函数的深度强化学习、基于策略梯度的深度强化学习和基于搜索与监督的深度强化学习;其次对深度强化学习领域的一些前沿研究方向进行了综述,包括分层深度强化学习、多任务迁移深度强化学习、多智能体深度强化学习、基于记忆与推理的深度强化学习等.最后总结了深度强化学习在若干领域的成功应用和未来发展趋势.
1
David Silver深度强化学习课程的随堂课件,通许易懂,非常值得收藏。
2019-12-21 19:23:40 17.99MB 机器学习 强化学习 david
1