这里是 ShowMeAI 持续分享的【开源eBook】系列!内容覆盖机器学习、深度学习、数据科学、数据分析、大数据、Keras、TensorFlow、PyTorch、强化学习、数学基础等各个方向。整理自各平台的原作者公开分享(审核大大请放手)
◉ 简介:这是本书的第二版,旨在为所有相关学科的读者提供一个清晰的、简单的强化学习关键思想&算法的说明。书籍在第一版的基础上,增加了近些年新的研究主题,内容重点放在核心的算法上。
◉ 目录:
介绍
多臂老虎机
有限马尔可夫决策过程
动态规划
蒙特卡罗方法
时差学习
n-step Bootstrapping
使用表格方法进行规划和学习
带近似的策略预测
带近似的策略控制
带近似的离策略方法
资格痕迹
策略梯度方法
心理学
神经科学
应用与案例研究
前沿
1