在使用深度强化学习算法(Deep Reinforce Learning,DRL)舶能量调度问题中,对智能体调度的结果难以判断,因此需要给出一个基准最优解,使得对智能体的调度结果能做出正确的评价,有助于增强DRL能量调度算法的说服力,同时对DRL能量调度算法的改进具有引导作用。本代码基于python,使用groubi求解器,建立了电力系统能量调度模型,并使用非线性规划算法求出了经济性最低的能量调度方式。本代码适合电力系统初学者学习。
2022-09-24 16:00:40 9KB python 能量调度 电力系统 groubi
1
文章算法来自王彦飞的论文《数值求解迭代Tikhonov正则化方法的一点注记》
2022-09-13 21:50:30 2KB 迭代Tikhonov正则化 反问题
1
加州大学Richard M. Murray教授等人由课程讲义编写的书稿,介绍了最优控制、滚动时域、随机系统、Kalman滤波等。
2022-09-07 16:51:09 1.1MB 最优控制 优化
1
用MATLAB优化工具箱解线性规划 命令:x=linprog(c,A,b) 命令:x=linprog(c,A,b,Aeq,beq) min z=cX 1、模型: 2、模型:min z=cX 注意:若没有不等式: 存在,则令A=[ ],b=[ ].
1
状态空间的最优控制体系是保守的,其近似算法应当保辛提出了基于分段常值精细积分方法的保辛摄动近似方法,在同一框架下求解了线性时变LQ最优控制中的计算问题,即变系数矩阵Riccati方程和状态反馈方程该算法是保辛的,具有很好的数值稳定性和精度算例验证了算法的有效性
2022-08-15 10:53:35 485KB 自然科学 论文
1
非线性规划有约束极小问题 模型: MATLAB求解此问题的命令是: [x,fval,exitflag,output,lambda,grad,hessian]=fmincon(‘fun’,x0,A,b,A1,b1,LB,UB,’nonlcon’,options,p1,p2,…) fun是目标函数的m_文件名.nonlcon是约束函数C(x)和C1(x)的m_文件名.文件输出为[C,C1].
2022-07-28 08:57:42 1.82MB 方法讲解
1

提出一类非线性不确定动态系统基于强化学习的最优控制方法. 该方法利用欧拉强化学习算法估计对象的未知非线性函数, 给出了强化学习中回报函数和策略函数迭代的在线学习规则. 通过采用向前欧拉差分迭代公式对学习过程中的时序误差进行离散化, 实现了对值函数的估计和控制策略的改进. 基于值函数的梯度值和时序误差指标值, 给出了该算法的步骤和误差估计定理. 小车爬山问题的仿真结果表明了所提出方法的有效性.

1
复合材料最优控制与结构优化设计中的多尺度模型与算法.pdf
2022-07-11 14:12:17 8.74MB 文档资料
MC求解非线性规划matlab代码
2022-07-11 12:07:35 12KB MC求解非线性规划matlab
在生产过程、军事行动、经济活动以及人类的其它有目的的活动中,常需要对被控系统或被控过程施加某种控制作用以使某个性能指标达到最优,这种控制作用称为最优控制
2022-07-05 19:58:43 5.32MB 最优控制
1