模仿学习基准实施
该项目旨在提供模仿学习算法的清晰实现。 目前,我们已经实现了行为克隆, (带有综合示例),和。
安装:
安装PyPI版本
pip install imitation
安装最新的提交
git clone http://github.com/HumanCompatibleAI/imitation
cd imitation
pip install -e .
可选的Mujoco依赖性:
请按照说明在安装 。
CLI快速入门:
我们提供了几个CLI脚本作为imitation实现的算法的前端。 这些使用进行配置和复制。
从examples / quickstart.sh中:
# Train PPO agent on cartpole and collect expert demonstrations. Tensorboard logs saved in `quickstar
1