在本文中,我们考虑了为连续时间非线性系统开发控制器的问题,其中控制该系统的方程式未知。 利用这些测量结果,提出了两个新的在线方案,这些方案通过两个基于自适应动态编程(ADP)的新实现方案来合成控制器,而无需为系统构建或假设系统模型。 为了避免对系统的先验知识的需求,引入了预补偿器以构造增强系统。 通过自适应动态规划求解相应的Hamilton-Jacobi-Bellman(HJB)方程,该方程由最小二乘技术,神经网络逼近器和策略迭代(PI)算法组成。 我们方法的主要思想是通过最小二乘技术对状态,状态导数和输入信息进行采样以更新神经网络的权重。 更新过程是在PI框架中实现的。 本文提出了两种新的实现方案。 最后,给出了几个例子来说明我们的方案的有效性。 (C)2014 ISA。 由Elsevier Ltd.出版。保留所有权利。
2023-03-21 17:45:57 901KB Model-free controller; Optimal control;
1

为了求解有限时域最优控制问题, 自适应动态规划(ADP) 算法要求受控系统能一步控制到零. 针对不能一步控制到零的非线性系统, 提出一种改进的ADP 算法, 其初始代价函数由任意的有限时间容许序列构造. 推导了算法的迭代过程并证明了算法的收敛性. 当考虑评价网络的近似误差并满足假设条件时, 迭代代价函数将收敛到最优代价函数的有界邻域. 仿真例子验证了所提出方法的有效性.

1
自适应动态规划(近似动态规划)——ADP MATLAB_MATLAB编程
1
使用自适应动态规划实现单极倒立摆的控制,可供学习参考
2022-11-07 17:10:32 1.72MB adp 动态规划 自适应动态规划 倒立摆
1
介绍了动态规划(DP), 强化学习(RL) 和 自适应动态规划(ADP).
1
神经网络自适应动态规划在污水处理过程控制中的应用.doc
利用ADP中的HDP(with two Critic Network)求解离散非线性系统,代码利用python实现。构建评价网络(Critic Network)、模型网络(Model Network),Model Network直接用原系统代替。(需要安装Pytorch;由于保存结果,因此需要在根目录先创建ADPresultfig文件夹;python文件只需要放在根目录下即可。)
2022-04-03 19:22:37 71KB 深度学习 ADP 自适应动态规划 Pytorch
1
本代码运用自适应动态规划理论,结合BP神经网络,设计实现多智能体系统的一致控制。其中的控制率是由HDP框架的BP神经网络基于智能体的实时状态数据自适应产生的。
利用ADP(自适应动态规划)中的HDP,实现对非线性离散时间系统的稳定控制。代码利用python实现。构建评价网络(Critic Network)、模型网络(Model Network)和执行网络(Action Network)三个网络。需要安装Pytorch;由于保存结果,因此需要在根目录先创建ADPresultfig文件夹;python文件只需要放在根目录下即可。
2021-11-11 17:22:15 85KB ADP 自适应动态规划 Python HDP
1
求解非零和微分对策的自适应动态规划
2021-10-09 10:17:26 479KB 研究论文
1