play-daxigua-using-Re强化学习:使用强化学习DQN算法,训练AI模型来玩合成大西瓜游戏,提供Keras版本和PARL(paddle)版本
2022-05-15 19:08:37 4KB
1
ARL 框架的名字来源于 PAddlepaddle Reinfocement Learning,是一款基于百度 PaddlePaddle 打造的深度强化学习框架。PARL 与现有强化学习工具和平台相比,具有更高的可扩展性、可复现性和可复用性,支持大规模并行和稀疏特征,能够快速 对工业级应用案例的验证。 这个在 github 上是开源的,但是鉴于有些朋友工具受限下载很慢,所以特地搬运过来!
1
paddlepaddle-PARL 二次修改
2021-02-22 21:08:32 25.14MB PARL
1
PAL是一种灵活高效的强化学习框架.具有可重复性的特点。我们给出的算法能够稳定地再现许多有影响的强化学习算法的结果。大规模的。支持数千CPU和多GPU的高性能并行训练的能力.可重复使用。存储库中提供的算法可以通过定义前向网络直接适应新任务,并自动建立训练机制。可扩展的。通过继承框架中的抽象类,快速构建新的算法。PARL is a flexible and high-efficient reinforcement learning framework.
2021-01-30 23:03:16 26.48MB PaddlePaddle 强化学习框架
1