总共178篇,基本涵盖了20年NIps上所有与强化学习相关的文章。 zip压缩包,不要解压密码,261M大小。 看一看顶会论文怎么写的,自己下笔也大概能有个章法,Good Luck! 勤奋决定天分!
2021-07-14 13:18:15 261.61MB 强化学习RL reinforcement learning NIPS2020
1
Can You Train a Dog to Sit? If so, You Can Master Reinforcement Learning in No time! Welcome to the world of reinforced learning. This is a world where self-driving cars can be seen on real roads, where programs can beat world champions, where robots are not only a part of futuristic movies. Sound too scientifically involved for your expertise? Don?t worry; reinforcement learning is much more straightforward than you think. You do not need a college degree or to be a world-class developer in order to build a reinforcement learning application. Some rudimentary Python programming skills and a basic knowledge of Machine Learning is all it takes for this book to turn you into an RL expert. By describing the concept of reinforcement learning in a simple, non-technical way, teaching you its elements, applications, and algorithms in the most comprehensive way possible while giving you a great jumping-off point with some amazing Python implementations, this book is a definite must-have for everyone who wants to master this popular branch of AI without drowning in the technical nonsense. Inside this Book You?ll Discover: The elements of reinforcement learning Reiniforcement Learning vs. other learning types Simulated evironments and Policies A guide to Markov Decision Processes Dynamic Programming An exploration of Monte Carlo Methods The secrets to Q Learning And much, much more! If this sounds like a good deal to you, read this book and become a Reinforcement Learning expert in a matter of days.
2021-07-14 11:49:05 28.77MB 强化学习 人工智能 机器学习
1
强化学习经典资料
2021-07-13 15:19:59 83.5MB 强化学习
1
LearningRacer-rl 概述 该软件能够在几分钟内通过深度强化学习来自我学习您的AI Robocar。 您可以使用Real Robocar和DonkeySim。 1.说明 许多DIY自驾车,例如JetBot或JetRacer,DonkeyCar,都通过监督学习来使用行为克隆。 该方法需要通过人工演示收集很多标记的数据。 在这种情况下,人类驾驶技术非常重要。 另一方面,在此软件中使用深度强化学习(DRL)。 通过与环境的交互,可以自动获得运行行为。 不需要人类标签的样本数据。 另外,该软件代理可以在Jetson Nano上运行。 为什么可以在Jetson Nano上运行并且学习时间短? 因为使用了SAC(软演员评论家)和VAE的集成。 SAC是最新的政策外强化学习方法。 另外,VAE预先在云服务器上作为SAC的CNN层进行训练。(这种方法称为状态表示学习)。 此方法由An
2021-07-13 11:32:16 17.25MB deep-reinforcement-learning sac jetbot jetson-nano
1
加州伯克利数学学院(Department of Mathematics, University of California, Berkeley)Lawrence C. Evans教授的最优控制笔记,非常简明扼要。原版没有目录,我添加了目录: 1 Introduction 3 2 Controllability, bang-bang principle 15 3 Linear time-optimal control 31 4 The Pontryagin Maximum Principle 41 5 Dynamic programming 72 6 Differential Game theory 88 7 Introduction to stochastic control theory 96 Appendix Proofs of the Pontryagin Maximum Principle 110
2021-07-12 16:36:46 698KB 最优控制 深度学习 数学 动态规划
1
PyTorch实现的强化学习算法集
2021-07-10 16:24:14 482KB Python开发-机器学习
1
清华大学智能驾驶实验室官网:http://www.idlab-tsinghua.com/thulab/labweb/index.html 本课程为强化学习与控制,由清华大学开设,长聘教授李升波主讲,共十一讲,本讲为第十一讲,主要介绍RL的各类拾遗,包括POMDP、鲁棒性、多智能体、元学习、逆强化学习以及训练平台等。
2021-07-09 21:06:30 4.5MB 强化学习 最优控制 POMDP 李升波教授
1
本课程为强化学习与控制,由清华大学开设,长聘教授李升波主讲,共十一讲,本讲为第三讲,主要介绍免模型学习的蒙特卡洛法,包括Monte Carlo估计,On-policy/off-policy,重要性采样等。
1
知识图论的深度强化学习 我们研究在大型知识图(KG)中学习推理的问题。 更具体地说,我们描述了一种用于学习多跳关系路径的新颖的强化学习框架:我们使用基于知识图嵌入的具有连续状态的基于策略的代理,这通过对最有希望的关系进行采样来在KG向量空间中进行扩展它的路径。 与以前的工作相比,我们的方法包括一种奖励功能,该功能考虑了准确度,多样性和效率。 实验表明,在Freebase和Never-Ending Language Learning数据集上,我们提出的方法优于基于路径排序的算法和知识图嵌入方法。 访问数据集 下载知识图数据集 如何运行我们的代码 解压缩数据,将数据文件夹放在代码目录中 在scr
2021-07-09 19:26:47 6.57MB tensorflow knowledge-graph reasoning emnlp2017
1
本课程为强化学习与控制,由清华大学开设,长聘教授李升波主讲,共十一讲,本讲为第五讲,主要介绍介绍带模型学习的动态规划法,包括策略迭代、值迭代、收敛性原理等。
1