上传者: 42131276
|
上传时间: 2021-12-06 16:50:57
|
文件大小: 15.06MB
|
文件类型: -
要求
python - 3.7
keras - 2.4.3
tensorflow - 2.2.0
项目1:车杆
介绍
在此任务中,我们必须在购物车顶部平衡一根杆。 动作空间的数量为2。此处动作空间是离散的。
0向左移动购物车
1向右移动购物车
我在大约60集中使用DQN解决了这个问题。 以下是得分与情节的关系图。
项目2:山地车
介绍
在此任务中,我们必须教车达到山顶处的目标位置。 操作空间的数量为3。在这种环境下,操作空间是离散的。
0向左移动汽车
1什么也不做
2向右移动汽车
我在大约15集中使用DQN解决了此问题。 以下是得分与情节的关系图。
项目3:Pendulam
介绍
在此任务中,我们必须平衡摆锤的颠倒状态。 作用空间的数量为1,这是施加在关节上的扭矩。 动作空间在这里是连续的。
0扭矩[-2,2]
我在大约100集中使用DDPG解决了这个问题。 以下是得分与情节的