上传者: 38659622
|
上传时间: 2023-03-21 17:45:57
|
文件大小: 901KB
|
文件类型: PDF
在本文中,我们考虑了为连续时间非线性系统开发控制器的问题,其中控制该系统的方程式未知。 利用这些测量结果,提出了两个新的在线方案,这些方案通过两个基于自适应动态编程(ADP)的新实现方案来合成控制器,而无需为系统构建或假设系统模型。 为了避免对系统的先验知识的需求,引入了预补偿器以构造增强系统。 通过自适应动态规划求解相应的Hamilton-Jacobi-Bellman(HJB)方程,该方程由最小二乘技术,神经网络逼近器和策略迭代(PI)算法组成。 我们方法的主要思想是通过最小二乘技术对状态,状态导数和输入信息进行采样以更新神经网络的权重。 更新过程是在PI框架中实现的。 本文提出了两种新的实现方案。 最后,给出了几个例子来说明我们的方案的有效性。 (C)2014 ISA。 由Elsevier Ltd.出版。保留所有权利。