针对一类未知的连续非线性系统, 提出一个基于单网络近似动态规划(ADP) 的近似最优控制方案. 该方 案通过设计一个新型的递归神经网络(RNN) 辨识器放松了系统模型需已知或部分已知的要求, 并利用一个神经网 络(NN) 近似系统的性能指标函数消除了常规ADP方法中的控制网络. 通过Lyapunov 理论分析严格证明了闭环系 统内所有信号一致最终有界, 并且所获得的性能指标函数和控制输入分别收敛到最优性能指标函数和最优控制输入 的小邻域内. 仿真结果验证了所提出控制方案的有效性.
为了求解有限时域最优控制问题, 自适应动态规划(ADP) 算法要求受控系统能一步控制到零. 针对不能一步控制到零的非线性系统, 提出一种改进的ADP 算法, 其初始代价函数由任意的有限时间容许序列构造. 推导了算法的迭代过程并证明了算法的收敛性. 当考虑评价网络的近似误差并满足假设条件时, 迭代代价函数将收敛到最优代价函数的有界邻域. 仿真例子验证了所提出方法的有效性.