在本文中,我们提出了一个多路径DP模型来解决路径规划问题,并证明了它能够在仅使用有限信息作为输入的情况下,找到能够以最短行程时间规划车辆路径的最优策略。我们可以对所提出的方法得出一些结论。
首先,通过在奖励函数中引入距离贡献指数DC I,我们的方法确保了代理可以选择更好的动作,并避免不必要的迂回。
第二,我们的方法不仅生成最优路径,而且生成每个交叉口的驾驶策略。这项政策可以为车辆的最佳路线提供几个可比较的替代方案,从而将交通分流到不同的路线,从而缓解拥堵漂移问题。请注意,介绍部分中提到的所有方法只输出一个
2023-04-30 23:08:35
3.64MB
强化学习
1