搜索【非线性动态系统|强化学习|最优控制|值函数|策略函数】的结果

Optimal Control Using Control Vector Parameterization：使用控制向量参数化解决最优控制问题的示例-matlab开发

要运行的文件：mainproc.m 控制向量参数化，也称为直接序列法，是求解最优控制问题的直接优化方法之一。直接优化方法的基本思想是将控制问题离散化，然后将非线性规划 (NLP) 技术应用于最终的有限维优化问题。问题是您希望从时间 $t = 0$ 的 $A=(0,0)$ 转向接近时间 T 的 $B=(4,4)$ 点。运动发生在 $ x_1, x_2$ 平面。您的控制变量是推力 $u$ 和推力角 $\theta$。角度 $\theta$ 是从 $x_1$ 轴测量的。为了让生活变得有趣，在 (3,0) 处有一个大质量，它施加的力与您与质量的距离的平方的倒数成正比。（详情见发布代码） *问题来自NCSU的“最优控制”课程（由Stephen Campbell博士主持）。

2021-11-28 16:15:24 99KB matlab

1

基于Q-learning的改进版强化学习算法

经过算法改进，实现了比Q学习更快的收敛速度，可以快速的找到最短路径，程序使用了matlab语言，适合初学者，也适合科研硕士研究。

2021-11-28 12:07:36 49KB matlab 路径规划 人工智能 强化学习

最优调节的闭环系统方框图-线性二次型最优控制

最优调节的闭环系统方框图：

2021-11-27 17:00:42 1.24MB 线性二次型 最优控制

1

基于深度强化学习的蜂窝网资源分配算法

针对蜂窝网资源分配多目标优化问题，提出了一种基于深度强化学习的蜂窝网资源分配算法。首先构建深度神经网络（DNN），优化蜂窝系统的传输速率，完成算法的前向传输过程；然后将能量效率作为奖惩值，采用Q-learning机制来构建误差函数，利用梯度下降法来训练DNN的权值，完成算法的反向训练过程。仿真结果表明，所提出的算法可以自主设置资源分配方案的偏重程度，收敛速度快，在传输速率和系统能耗的优化方面明显优于其他算法。

2021-11-27 15:44:17 1.09MB 蜂窝网 资源分配 深度强化学习 神经网络

1

用MATLAB设计最优控制系统（源代码、PPT，ｗｏｒｄ）

用MATLAB设计最优控制系统，并用GUI实现可视化界面。最优控制是在一定的约束条件下，从已给定的初始状态出发，确定最优控制作用的函数式，使目标函数为极小或极大。在设计最优控制器的过程中，运用MATLAB最优控制设计工具，会大大减小设计的复杂性。

2021-11-27 10:13:51 2.29MB 最优控制系统 GUI MATLAB

1

具有指定导数的 Hermite 三次插值多项式：计算插值函数值和一阶导数的分段三次多项式。-matlab开发

PP = PCHIPD(X,Y,D) 提供了分段三次多项式，该多项式在位置 X 处插入值 Y 和导数 D。这是为了增加内置的 Matlab 函数 PCHIP，它不允许用户指定导数。 X 必须是向量。如果 Y 和 D 是向量，则 Y(i) 和 D(i) 是要在 X(i) 处匹配的值和导数。如果 Y 和 D 是矩阵，则 size(Y,2) == size(D,2) == length(X)。另外，size(Y,1) == size(D,1)。使用它来插入向量值函数。 YY = PCHIPD(X,Y,D,XX) 与 YY = PPVAL(PCHIPD(X,Y,D),XX) 相同，因此在 YY 中提供了 XX 处的插值值。

2021-11-26 14:53:58 3KB matlab

1

UE4蓝图API离线

UE4官方蓝图API离线资源。方便学习者不必在线打开网页来查询蓝图API。提高了学习效率。本资源仅用于学习查询

2021-11-25 16:44:53 12.98MB unreal 蓝图 UE4 强化学习

1

LQR_lqr_车辆悬架线性LQR控制_最优控制_源码

对于简单的系统进行LQR线性最优控制效果，并输出一些基本结果

2021-11-25 15:21:35 6KB lqr 车辆悬架线性LQR控制 最优控制

强化学习方法合集.zip

本文件夹包含强化学习方法的python案例代码，Markov文件夹里是马尔科夫环境的编写-鸟儿找伴。Markov-DP文件夹里的untitled2为策略迭代主函数，untitled3为值迭代函数。Markov – MC文件夹里是贪婪策略的马尔科夫和同策略的马尔科夫。Markov - table-func文件夹里为基于特征线性函数表格的策略。PG_CartPole包含了策略梯度离散、策略梯度连续、TD0-AC、Minibatch-MC-AC、ppo、ddpg、基于模型的强化学习（模型用神经网络构建）。

2021-11-25 09:08:15 3.33MB python

1

连续小推力轨道最优控制问题

2021-11-24 16:20:08 368KB 研究论文

1

个人信息

热门下载

最新下载

其他资源