NDQ:通过交流最小化学习几乎可分解的价值函数
笔记
该代码库基于和代码库,这些论文基于“ 。
在此代码库中还可以找到以下方法的实现,这些实现由的作者完成:
使用以下命令构建Dockerfile
cd docker
bash build.sh
设置《星际争霸II》和SMAC:
bash install_sc2.sh
这会将SC2下载到3rdparty文件夹中,并复制运行所需的地图。
requirements.txt文件可用于将必要的软件包安装到虚拟环境中(不推荐)。
进行实验
以下指令在教学任务hallway上训练NDQ。
python3 src/main.py
--config=categorical_qmix
--env-config=join1
with
env_args.n_agents=2
env_args.state_numbers=[6,6]
obs_last_a
2021-11-23 19:19:42
8.08MB
Python
1