路径规划问题,有三种环境配置可实现,以下是代码来源,基于此做的实验 https://blog.csdn.net/jacken3/article/details/119803094
2022-10-18 20:05:16 472KB 强化学习 路径规划
1
在这个项目中,我们在MATLAB实时编辑器环境中模拟了交互式迷宫环境,并实现了两种经典的Rl(强化学习)算法-Q学习和sarsa算法。 通过创建一个在迷宫中交互移动的代理,可以使用两种算法来训练最高激励值奖励和最佳迷宫行走方法。 最后,我们比较了两种算法的性能。
2021-11-20 10:07:37 411KB matlab
1
#3.1_Sarsa_算法更新__(强化学习_Reinforcement_Learning_教学)
2021-09-01 21:00:07 12.89MB 学习资源
MATLAB强化学习代码包,用于解决多步决策模型(网格迷宫问题)的Sarsa算法。 编程与算法的详细说明可参看我的专栏:https://blog.csdn.net/weixin_43723517/category_9676083.html "I thought what I'd do was I'd pretend I was one of those deaf-mutes, or should I?"
2021-06-27 23:20:29 2KB matlab 强化学习 机器学习 Sarsa算法
1