上传者: 42174176
|
上传时间: 2021-12-12 21:46:08
|
文件大小: 9.8MB
|
文件类型: -
深度强化学习指南(与Keras和OpenAi体育馆一起使用)
使用Keras和OpenAi体育馆进行深度强化学习策略梯度方法的分步教程。
在这个简短的项目中,我们将使用强化学习算法(策略梯度方法-REINFORCE)训练神经网络玩Pong游戏。
如果要运行它,则只需克隆存储库,然后打开钢筋_learning_pong_keras_policy_gradients.ipynb ,然后阅读并运行笔记本
我们训练了一个简单的200个隐藏的神经元网络和一个卷积模型。
简单网络的示例播放:
简单网络玩游戏的视频( ):
卷积网络玩游戏的视频( ):
考虑到有限的时间和出于学习目的,我并不是要寻找一个受过良好训练的代理,但我希望这个项目可以帮助人们熟悉rl算法和keras的基本过程。 上面的视频花了3天时间让代理在慢速的计算机上学习。 为了获得生产结果,需要更多的培训和调整,这不是我