后视体验重播(HER)
这是的pytorch实现。
致谢:
要求
python = 3.5.2
openai-gym = 0.12.5(支持mujoco200,但您需要使用Gym> = 0.12.5,它在以前的版本中有一个错误。)
mujoco-py = 1.50.1.56( 请使用此版本,如果您使用mujoco200,则可能在FetchSlide-v1中失败)
pytorch = 1.0.0(如果使用pytorch-0.4.1,则可能会出现数据类型错误。稍后我将对其进行修复。 )
mpi4py
待办事项清单
支持GPU加速-尽管我添加了GPU支持,但是如果您没有强大的计算机,我仍然不建议您使用。
为每个MPI添加多个环境。
添加FetchSlide-v1的图和演示。
指令运行代码
如果要使用GPU,只需添加--cuda标志(不推荐,最好使用CPU) 。
训练FetchR
1