Sutton&Barto撰写的《强化学习:简介》 (第2版)包括本章练习。 该资料库存储了我在理解强化学习过程中对这些练习的尝试。 所有练习均在Rmarkdown中完成,并按章节分开。
章节:
1:简介
第一部分:表格求解方法
2:多臂匪
3:有限马尔可夫决策过程
4:动态编程
5:蒙特卡洛方法
6:时差学习
7:n步自举
8:使用表格方法进行计划和学习
第二部分:近似解法
9:基于策略的预测
10:基于策略的近似控制
11:近似的非策略方法
12:资格跟踪
13:政策梯度法
第三节:深入了解
14:心理学
15:神经科学
16:应用和案例研究
17:边疆
1