这里是 ShowMeAI 持续分享的【开源eBook】系列!内容覆盖机器学习、深度学习、数据科学、数据分析、大数据、Keras、TensorFlow、PyTorch、强化学习、数学基础等各个方向。整理自各平台的原作者公开分享(审核大大请放手)
◉ 简介:本书对不确定条件下的决策算法作了广泛的介绍,内容涵盖了与决策有关的各种主题,介绍了基本的数学问题公式和解决这些问题的算法。
◉ 目录:
第一部分:概率推理
- 表征
- 推理
- 参数学习
- 结构学习
- 简单决策
第二部分:顺序问题
- 精确解法
- 近似值函数
- 在线规划
- 政策搜索
- 政策梯度估计
- 政策梯度优化
- 角色批判方法
- 政策验证
第三部分:模型的不确定性
- 探索和利用
- 基于模型的方法
- 无模型的方法
- 模仿学习
第四部分:状态的不确定性
- 信念
- 准确的信念状态规划
- 离线信念状态规划
- 在线信念状态规划
- 控制器抽象
第五部分:多Agent系统
- 多Agent推理
- 序列问题
- 状态的不确定性
- 协作代理
1