上传者: 42130889
|
上传时间: 2021-10-26 18:58:14
|
文件大小: 14KB
|
文件类型: -
pytorch-LunarLander
OpenAI Gym中针对LunarLander-v2环境的不同Deep RL算法的PyTorch实现
我们实施了3种不同的RL算法来解决LunarLander-v2环境:
模仿学习
加强
优势-演员-批评(A2C)
注意:模仿学习是在Keras中实现的,另外两种算法是在PyTorch中实现的
指示:
安装所有依赖项
克隆仓库
运行以下命令:
3.1)python imitation.py 3.2)python reinforce.py 3.3)python a2c.py