状态:存档(代码按原样提供,预计不会更新)
多代理深度确定性策略梯度(MADDPG)
这是用于实现论文中提出的MADDPG算法的代码: 。 它被配置为与一起运行。 注意:自原始论文以来,此代码库已进行了重组,结果可能与论文中所报告的有所不同。
更新:可以在找到策略集合和策略估计的原始实现。 该代码按原样提供。
安装
要安装,请cd进入根目录,然后键入pip install -e .
已知依赖项:Python(3.5.4),OpenAI Gym(0.10.5),tensorflow(1.8.0),numpy(1.14.5)
案例研究:多代理粒子环境
我们在这里演示如何将代码与结合使用。
按照README文件的说明下载并安装MPE代码。
确保已将multiagent-particle-envs添加到您的PYTHONPATH (例如, ~/.bashrc或~/.bash_profile
1