matlab
绘图的形状代码
Q学习的
Matlab
实现
本项目是基于迷宫环境.
与最短路径算法不同,
Q学习算法使agent能够通过与环境交互(采取四个方向的动作),
计算从给定的起点到固定的终点的最短路径.
文件结构
readMaze.m:
读取迷宫数据,
目前存储为矩阵的形式
q_learning.m:
Q学习的核心算法
plotMaze.m:
绘制平均路径,
地图和各个点的最佳方向
actions.m:
定义动作空间
plotQ.m:
单独保存某一次迭代的Q矩阵图像,
默认保存为目录下的images文件夹
main.m:
执行主要功能
说明
如果需要修改起始点,
并绘制相关的路径,
可以在main.m运行完q_learning函数之后,
修改start并运行
start
=
[2,3];
plotMaze(OM,
Q,
HA,
HP,
start,
dest,
seed,
gamma,
alpha,epsilon,lambda);
代码即可绘制其他起点的图像.
结果
输出的Q值矩阵(迭代1000次):
各个状态的采取的最优的行为:
最优的路径:
平均的回报:
需求
基于
Ma
2021-10-22 19:04:07
135KB
系统开源
1