完全耦合的正倒向随机微分方程系统在非Lipschitz代价泛函下最优控制的存在性,孟庆欣,张奇,运用凸分析中的最优存在定理,本文研究了最优随机控制的存在性。而所研究的随机系统是完全耦合的线性正倒向随机微分方程,且其代价�
2024-03-02 08:36:03 149KB 首发论文
1
Optimal control of the nonlinear one dimensional periodic wave equation with x-dependent coefficients,李恒燕,冀书关,This paper is concerned with an optimal control problem governed by the nonlinear one dimensional periodic wave equation with x-dependent coefficients. The control of the system is
2024-02-25 09:59:52 88KB 首发论文
1
在本文中,我们考虑了为连续时间非线性系统开发控制器的问题,其中控制该系统的方程式未知。 利用这些测量结果,提出了两个新的在线方案,这些方案通过两个基于自适应动态编程(ADP)的新实现方案来合成控制器,而无需为系统构建或假设系统模型。 为了避免对系统的先验知识的需求,引入了预补偿器以构造增强系统。 通过自适应动态规划求解相应的Hamilton-Jacobi-Bellman(HJB)方程,该方程由最小二乘技术,神经网络逼近器和策略迭代(PI)算法组成。 我们方法的主要思想是通过最小二乘技术对状态,状态导数和输入信息进行采样以更新神经网络的权重。 更新过程是在PI框架中实现的。 本文提出了两种新的实现方案。 最后,给出了几个例子来说明我们的方案的有效性。 (C)2014 ISA。 由Elsevier Ltd.出版。保留所有权利。
2023-03-21 17:45:57 901KB Model-free controller; Optimal control;
1
这是HPIPM,一种高性能的内点方法求解器,用于密集的,最优的控制结构和树形结构的凸二次方程序。 它提供有效的密集算法和结构探索算法的实现,以解决一般在模型预测控制和嵌入式优化中出现的中小型问题,并且它依赖于高性能线性代数程序包BLASFEO。 HPIPM(和BLASFEO,这是一个依赖项),同时包含make和cmake构建系统。 首选的是make ,它可以用来编译和运行任何语言的任何库,接口和示例。 make也用于连续集成travis脚本中。 cmake只能用于编译库,而感兴趣的用户应通过从各种Makefile的命令中Makefile灵感来编译接口并自己运行示例。 入门: 开始使用HPIPM的最佳方法是查看/hpipm/examples/ 。 HPIPM可以从C直接使用,但是也有到Python和Matlab的接口。 根据您要使用HP​​IPM的级别,请查看下面的以下部分。 可以在do
1
这是培生经典书,关于自适应、最优估计、最优控制。书名副标题GPC是广义预测控制之意。书是扫描版,但很清楚。作者是牛人bitmead。对于那些关心卡尔曼滤波的人来说,这也是基本参考。作者在其课程中多处引用他自己的这本书,牛人看来都相信自己!
2023-01-03 10:28:36 1.46MB 估计+自适应
1
Dynamic Programming and Optimal Control Volume I THIRD EDITION P. Bertsekas
2022-10-28 14:19:00 8.57MB Dynamic Programming
1
Optimal Control Theory - An Introduction.(Kirk D. Dover, 2004)Optimal Control Theory - An Introduction.(Kirk D. Dover, 2004)Optimal Control Theory - An Introduction.(Kirk D. Dover, 2004)
2022-04-17 23:24:00 11.01MB Optimal Control Theory
1
经典的最优控制教材 国外比较经典的 希望大家多多评
2022-03-17 17:45:35 24.55MB 最优控制
1
4.3 配置内容 4.4 共性配置 此配置适用于所有的中石化企业,且此配置由总部负责配置,其他单位不能任意增减,可以选择使用。 财务会计及集成部分 第 19 页 / 共 133 页
2022-03-05 10:53:13 9.39MB SAP后台配置
1
本文介绍了在线增强Q学习算法,以为未知离散时间线性系统设计H∞跟踪控制器。 构建了由原始系统和命令生成器组成的扩充系统,并引入了折现性能函数,建立了折现博弈代数Riccati方程(GARE)。 提出了GARE解的存在条件,并为折现因子找到了下界,以保证H∞跟踪控制解的稳定性。 然后推导Q函数Bellman方程,在此基础上开发了强化Q学习算法,以在不了解系统动力学的情况下学习H∞跟踪控制问题的解决方案。 提出了状态数据驱动和输出数据驱动的强化Q学习算法来寻找控制策略。 与基于值函数逼近(VFA)的方法不同,事实证明,在满足持久激励(PE)条件的探测噪声下,Q学习方案不会带来Q函数Bellman方程解的偏差,因此,收敛到名义折扣GARE解决方案。 而且,所提出的输出数据驱动方法比状态数据驱动方法更强大,因为在实际应用中可能无法完全测量整个系统的状态。 以单相电压源UPS逆变器为例,验证了所提出的Q学习算法的有效性。
2022-02-20 16:36:53 1.3MB Data driven optimal control
1