DeepRL
深度强化学习的框架。
特征:
算法分为模块
易于异步运行的算法
易于添加新算法
依存关系
python3.6
麻木
火炬
健身房
安装
git clone https://github.com/ppaanngggg/DeepRL
pip install -e .
模块:
1.代理
DoubleDQNAgent:具有双Q学习功能的基础深度Q学习
通过深度强化学习进行人为控制
双重Q学习的深度强化学习
DDPGAgent:通过深度确定性策略梯度继续控制
具有深度强化学习的连续控制
PPOAgent:通过近端策略优化继续控制
近端策略优化算法
2.重播
重播:基本重播,从池中随机选择并删除最旧的一个
通过深度强化学习进行人为控制
ReservoirReplay:从池中随机选择一个,然后随机删除一个,用于NFSPAgent的策略网络
在不完全信息游戏中通过自我玩法进行深度强化
2022-03-11 11:06:16
38KB
Python
1