Q学习 使用基于Q学习的强化学习技术预测量化网格中的最短路径 该程序可用于预测有限量化网格中的最短路径。 活动区域以“绿色”突出显示,而限制区域以“黑色”突出显示。 起点用“黄色”突出显示,终点用“红色”突出显示。 RL代理的当前位置由“蓝色”颜色表示,而预测路径在右侧剪辑上以“海军蓝色”颜色绘制。 允许RL代理随机移动并探索可移动区域以填充Q矩阵。 RL代理到达目的地后,将根据R-Matrix提供奖励。 然后,RL代理从新的随机点重新开始搜索,在此它再次寻找到达目的地点的随机路径。 经过一些迭代后,预测路径(右侧)似乎收敛了,并且短路了可能的路径。 (注意:所有对角线移动和笔直移动均具有相等的权重) 编译 g ++ qlearn.cpp -o main`pkg-config --cflags --libs opencv` -std = c ++ 11 用法 ./main arenaWi
2022-03-02 07:55:42 130KB C++
1
对彩色图像进行预测量化编码,运用matlab语言实现仿真。
2021-05-05 16:28:20 2KB matlab 预测量化
1