上传者: 42353399
|
上传时间: 2021-11-25 09:08:15
|
文件大小: 3.33MB
|
文件类型: ZIP
本文件夹包含强化学习方法的python案例代码,Markov文件夹里是马尔科夫环境的编写-鸟儿找伴。Markov-DP文件夹里的untitled2为策略迭代主函数,untitled3为值迭代函数。Markov – MC文件夹里是贪婪策略的马尔科夫和同策略的马尔科夫。Markov - table-func文件夹里为基于特征线性函数表格的策略。PG_CartPole包含了策略梯度离散、策略梯度连续、TD0-AC、Minibatch-MC-AC、ppo、ddpg、基于模型的强化学习(模型用神经网络构建)。