南京大学俞扬副教授在第二期《人工智能前沿讲习班》的报告完整PPT,内容包括强化学习的概念、主要算法类型和应用等,值得反复精读,目录如下:
一、介绍(Introduction)
二、马尔可夫决策过程(Markov Decision Process)
三、从马尔可夫决策过程到强化学习(from Markov Decision Process to Reinforce Learning)
四、值函数估计(Value function approximation)
五、策略搜索(Policy Search)
六、游戏中的强化学习(Reinforcement Learning in Games)
七、强化学习总结
八、强化学习资源推荐
第一,强化学习到底是什么?
第二,强化学习有哪几类算法?这几类算法的思路是什么?
第三,强化学习能用在什么地方?应用时会遇到什么限制?
1