上传者: 38506138
|
上传时间: 2021-10-04 22:11:13
|
文件大小: 10KB
|
文件类型: -
此代码使用迷宫示例演示了强化学习 (Q-learning) 算法,其中机器人必须仅通过向左、向右、向上和向下方向移动才能到达目的地。 在每一步,根据机器人动作的结果,它会被教导和重新教导它是否是一个好的动作,最终整个过程一次又一次地重复,直到它到达目的地。 此时,该过程将再次开始,以便可以验证所学的内容,并且可以忘记在第一遍期间所做的不必要的移动等等。 这是一个很好的教程示例,适用于必须在旅途中进行学习的情况,即不使用训练示例。 可用于游戏中学习和提升AI算法与人类玩家等多种场景的竞争能力。 在小迷宫上收敛会很快,而在大迷宫上收敛可能需要一些时间。 您可以通过修改代码来提高收敛速度,使 Q-learning 高效。
有四个m文件QLearning_Maze_Walk.m - 演示 Q-learning 算法在选定迷宫上的工作Random_Maze_Walk.m - 演示用于比较的随机选