上传者: 38680664
|
上传时间: 2021-12-29 13:59:36
|
文件大小: 7.86MB
|
文件类型: -
离散控制Matlab代码DPA机会
关于这个项目
动态规划算法(DPA)解决具有联合概率约束的问题。
它可用于解决路径规划问题,在这种情况下,碰到障碍物的机会必须保持在阈值以下。
该项目实现了本文[1],可以直接用于有效解决具有较大状态作用噪声空间的问题。
以下动画逐步显示了DPA在路径规划问题上的结果。
路径规划问题定义
与[1]中的代码一样,该代码通过以下动态方式解决了路径规划问题:
如论文[1]所示,该模型足以解决火星的进入,下降和着陆问题。
请注意,对于此处考虑的路径规划问题,包含100x100个状态,使用我们的离散网格可以获取多达81个不同的值,并且噪声分布增加了应用DPA所需的计算量,因此需要对问题进行有效的解决。
与[1]中一样,我们使用。
因此,为了最小化问题的复杂性,我们使用来近似离散化的值。
成本定义如下:
我们还定义了需要最小化的拉格朗日和定义状态是否为障碍的变量:
为了有效地计算每个状态和动作的预期成本值,我们将每个动作的成本与概率过滤器进行卷积,因为
这样就避免了通过应用不同的值来使用随机方法的需要,该值可以取平均值(蒙特卡洛)以获取每个操作的成本估算值。
这