上传者: 42109125
|
上传时间: 2021-10-25 19:20:27
|
文件大小: 5.48MB
|
文件类型: -
概述
这是关于强化学习的注释和示例的集合。 这些内容基于Richard S. Sutton和Andrew G. Bartow撰写的《》第二版。
内容
该存储库中包含以下注释和示例:
第2章-多臂强盗
第三章-有限马尔可夫决策过程
第4章-动态编程
第5章-蒙特卡洛方法
笔记
二十一点
解决二十一点
二十一点状态值的非政策估计
无限方差
赛马场
第六章-时差学习
笔记
随机游走
批量更新下的随机游走
风之网格世界
悬崖漫步