机器人学习研究框架
RL算法
PPO
DDPG
TD3
SAC
IL算法
公元前
盖尔
数模转换器
目录
run.py :只需启动main.py
main.py :设置实验并使用trainer.py培训
trainer.py :包含培训和评估代码
algorithms/ :所有RL和IL算法的实现
config/ : config/__init__.py超参数
environments/ :注册环境(OpenAI Gym和Deepmind Control Suite)
networks/ : networks/实现,例如政策和价值功能
utils/ :包含辅助函数
先决条件
Ubuntu 18.04或更高版本
Python 3.6
Mujoco 2.0
安装
安装mujoco 2.0并将以下环境变量添加到~/.bashrc或~/.zshrc
# download mujoc
2022-05-15 11:06:10
57KB
Python
1