Sutton&Barto撰写的《强化学习:简介》 (第2版)包括本章练习。 该资料库存储了我在理解强化学习过程中对这些练习的尝试。 所有练习均在Rmarkdown中完成,并按章节分开。 章节: 1:简介 第一部分:表格求解方法 2:多臂匪 3:有限马尔可夫决策过程 4:动态编程 5:蒙特卡洛方法 6:时差学习 7:n步自举 8:使用表格方法进行计划和学习 第二部分:近似解法 9:基于策略的预测 10:基于策略的近似控制 11:近似的非策略方法 12:资格跟踪 13:政策梯度法 第三节:深入了解 14:心理学 15:神经科学 16:应用和案例研究 17:边疆
2023-01-15 12:51:20 2KB
1
Sutton强化学习经典教材及python代码,全英文,适合对强化学习有兴趣的人使用
2022-07-20 15:28:11 17.68MB 强化学习 Sutton 代码
1
Draft, Second edition, in progress. Richard S. Sutton and Andrew G. Barto
2022-07-14 18:34:50 8.76MB 强化学习 Sutton
1
强化学习经典英文入门书,强化学习鼻祖sutton大作,入门必读
2022-01-06 12:21:49 11.65MB 强化学习 sutton
1
This introductory textbook on reinforcement learning is targeted toward engineers and scientists in artificial intelligence, operations research, neural networks, and control systems, and we hope it will also be of interest to psychologists and neuroscientists. 关于强化学习的一本原著,花钱在淘宝上买的。很值得一看的一本书~
2021-11-18 21:32:53 3.59MB Sutton Barto MIT Press
1
Richard S. Sutton, Andrew G. Barto-Reinforcement Learning_ An Introduction-MIT Press (1998)高清版经典教材
2021-11-08 15:43:52 2.39MB 强化学习 经典教材
1
强化学习解决方案第二版(Richard S. Sutton的,Andrew G. Barto) 第12章已更新。 有关详细信息,请参见下面的日志。 那些正在使用它来完成您的作业的学生,​​请停止该作业。 本手册旨在为数百万没有官方指南或适当学习环境的自学人士提供服务。 而且,当然,作为个人项目,它会出现错误。 (如果发现任何问题,则有助于解决问题)。 欢迎来到这个项目。 这是一个很小的项目,我们还没有做太多的编码,但是我们一起合作完成了著名的RL书籍《强化学习》(萨顿的介绍)中的一些棘手的练习。 您可能知道这本书,尤其是去年出版的第二版,没有正式的解决方案手册。 如果将答案发送到作者留下的电子邮件地址,则将返回不完整且较旧的伪造答题纸。 那么,为什么我们不写我们自己的呢? 大多数问题都是数学证明,可以很好地学习理论主干,但其中一些是颇具挑战性的编码问题。 两者都将逐渐更新,但数学将排在第
1
资源包含《Reinforcement Learning: An Introduction》两个版本英文pdf/chm电子书和部分翻译资料。
2021-09-17 21:37:15 59.73MB 强化学习 RL Sutton 教程
1
an introduction to reinforcement learning by Sutton 稳定稿哈哈哈哈哈哈哈哈
2021-09-16 16:55:39 49.14MB Sutton 强化学习
1
Matlab 求解偏微分的代码虚拟元素方法 此存储库包含以下代码的 Python 翻译: 它使用最低阶虚拟元素方法解决了一个玩具问题,即广义多边形网格上的二维泊松方程。 用法 $ python3 vem.py --help usage: vem.py [-h] [-d D] [-o O] [--save_plot] [--title TITLE] i This script solves 2-D Poisson Equation on general polygonal meshes using Virtual Element Method of the lowest order. positional arguments: i Path to input mesh optional arguments: -h, --help show this help message and exit -d D Specifies the shape of the 2D domain. Possible values are: - s: Square Domain - l: L-Shaped Do
2021-09-13 20:31:02 905KB 系统开源
1