要运行的文件:mainproc.m 控制向量参数化,也称为直接序列法, 是求解最优控制问题的直接优化方法之一。 直接优化方法的基本思想是将控制问题离散化,然后将非线性规划 (NLP) 技术应用于最终的有限维优化问题。 问题是您希望从时间 $t = 0$ 的 $A=(0,0)$ 转向接近时间 T 的 $B=(4,4)$ 点。运动发生在 $ x_1, x_2$ 平面。 您的控制变量是推力 $u$ 和推力角 $\theta$。 角度 $\theta$ 是从 $x_1$ 轴测量的。 为了让生活变得有趣,在 (3,0) 处有一个大质量,它施加的力与您与质量的距离的平方的倒数成正比。 (详情见发布代码) *问题来自NCSU的“最优控制”课程(由Stephen Campbell博士主持)。
2021-11-28 16:15:24 99KB matlab
1
经过算法改进,实现了比Q学习更快的收敛速度,可以快速的找到最短路径,程序使用了matlab语言,适合初学者,也适合科研硕士研究。
2021-11-28 12:07:36 49KB matlab 路径规划 人工智能 强化学习
最优调节的闭环系统方框图:
2021-11-27 17:00:42 1.24MB 线性二次型 最优控制
1
针对蜂窝网资源分配多目标优化问题,提出了一种基于深度强化学习的蜂窝网资源分配算法。首先构建深度神经网络(DNN),优化蜂窝系统的传输速率,完成算法的前向传输过程;然后将能量效率作为奖惩值,采用Q-learning机制来构建误差函数,利用梯度下降法来训练DNN的权值,完成算法的反向训练过程。仿真结果表明,所提出的算法可以自主设置资源分配方案的偏重程度,收敛速度快,在传输速率和系统能耗的优化方面明显优于其他算法。
1
用MATLAB设计最优控制系统,并用GUI实现可视化界面。 最优控制是在一定的约束条件下,从已给定的初始状态出发, 确 定最优控制作用的函数式,使目标函数为极小或极大。在设计最优控制器的过程中,运用MATLAB最优控制设计工具,会大大减小设计的复杂性。
2021-11-27 10:13:51 2.29MB 最优控制系统 GUI MATLAB
1
PP = PCHIPD(X,Y,D) 提供了分段三次多项式,该多项式在位置 X 处插入值 Y 和导数 D。这是为了增加内置的 Matlab 函数 PCHIP,它不允许用户指定导数。 X 必须是向量。 如果 Y 和 D 是向量,则 Y(i) 和 D(i) 是要在 X(i) 处匹配的值和导数。 如果 Y 和 D 是矩阵,则 size(Y,2) == size(D,2) == length(X)。 另外,size(Y,1) == size(D,1)。 使用它来插入向量值函数。 YY = PCHIPD(X,Y,D,XX) 与 YY = PPVAL(PCHIPD(X,Y,D),XX) 相同,因此在 YY 中提供了 XX 处的插值值。
2021-11-26 14:53:58 3KB matlab
1
UE4官方蓝图API离线资源。方便学习者不必在线打开网页来查询蓝图API。提高了学习效率。本资源仅用于学习查询
2021-11-25 16:44:53 12.98MB unreal 蓝图 UE4 强化学习
1
对于简单的系统进行LQR线性最优控制效果,并输出一些基本结果
2021-11-25 15:21:35 6KB lqr 车辆悬架线性LQR控制 最优控制
本文件夹包含强化学习方法的python案例代码,Markov文件夹里是马尔科夫环境的编写-鸟儿找伴。Markov-DP文件夹里的untitled2为策略迭代主函数,untitled3为值迭代函数。Markov – MC文件夹里是贪婪策略的马尔科夫和同策略的马尔科夫。Markov - table-func文件夹里为基于特征线性函数表格的策略。PG_CartPole包含了策略梯度离散、策略梯度连续、TD0-AC、Minibatch-MC-AC、ppo、ddpg、基于模型的强化学习(模型用神经网络构建)。
2021-11-25 09:08:15 3.33MB python
1
连续小推力轨道最优控制问题
2021-11-24 16:20:08 368KB 研究论文
1