模仿学习基准实施 该项目旨在提供模仿学习算法的清晰实现。 目前,我们已经实现了行为克隆, (带有综合示例),和。 安装: 安装PyPI版本 pip install imitation 安装最新的提交 git clone http://github.com/HumanCompatibleAI/imitation cd imitation pip install -e . 可选的Mujoco依赖性: 请按照说明在安装 。 CLI快速入门: 我们提供了几个CLI脚本作为imitation实现的算法的前端。 这些使用进行配置和复制。 从examples / quickstart.sh中: # Train PPO agent on cartpole and collect expert demonstrations. Tensorboard logs saved in `quickstar
1