上传者: 38734008
|
上传时间: 2022-01-02 17:25:36
|
文件大小: 473KB
|
文件类型: -
项目描述:
在该项目中,你将使用强化学习算法,实现一个自动走迷宫机器人。
如上图所示,智能机器人显示在右上角。在我们的迷宫中,有陷阱(红色×××)及终点(蓝色的目标点)两种情景。机器人要尽量避开陷阱、尽快到达目的地。
小车可执行的动作包括:向上走 u、向右走 r、向下走 d、向左走l。
执行不同的动作后,根据不同的情况会获得不同的奖励,具体而言,有以下几种情况。
撞到墙壁:-10
走到终点:50
走到陷阱:-30
其余情况:-0.1
我们需要通过修改 robot.py 中的代码,来实现一个 Q Learning 机器人,实现上述的目标。
Section 1 算法理解
1.1