本文考虑了连续时间马尔可夫决策过程中平均报酬的方差优化问题。 假设状态空间是可计数的,而动作空间是Borel可测量的空间。 本文的主要目的是在确定性平稳策略空间中找到方差最小的策略。 与传统的马尔可夫决策过程不同,方差准则中的成本函数将受到未来行动的影响。 为此,我们通过引入称为伪方差的概念将方差最小化问题转换为标准(MDP)。 通过给出伪方差优化问题的策略迭代算法,推导了原始方差优化问题的最优策略,并给出了方差最优策略的充分条件。 最后,我们用一个例子来说明本文的结论。
1
基于迭代局域搜索的智能优化算法求解车辆调度问题研究.pdf
2023-12-13 19:56:19 346KB tsp tabu 车辆调度
1
大型稀疏线性方程组的迭代数值解法的英文教材
2023-12-13 16:29:51 3.35MB 稀疏矩阵 线性方程
1
基于麻雀算法优化深度置信网络(SSA-DBN)的分类预测,优化参数为隐藏层节点数目,迭代次数,学习率。 多特征输入单输出的二分类及多分类模型。程序内注释详细,直接替换数据就可以用。 程序语言为matlab,程序可出分类效果图,迭代优化图,混淆矩阵图。
2023-12-07 13:52:07 82KB 网络 网络
1
雅各比迭代matlab代码汉·雅各比 快速(以秒为单位)求解Hamilton-Jacobi PDE以梯度限制2D或3D中定义的标量场。 求解器的输入以列优先顺序打包,z是变化最快的维度。 编译 此代码旨在使用混合。 在MATLAB中输入以下命令: mex CXXFLAGS =“ $ CXXFLAGS -std = c ++ 11” FastHJ.cpp 注意:您可能必须从终端(在类似Linux的操作系统上)启动MATLAB,如下所示: LD_PRELOAD = / usr / lib / x86_64-linux-gnu / libstdc ++。so.6 matlab ...但是首先尝试不使用MATLAB。 用法 通过更改以下代码的适当部分,从MATLAB中操作该代码。 dims = [nrows ncols nz]; % note: nz MUST be 1 for 2D fields. elen = % size of grid cell dfdx = % decimal fraction representing smoothness itmax = % maximum num
2023-12-04 16:12:54 3.06MB 系统开源
1
可变分数延迟FIR滤波器WLS设计的矩阵迭代算法
2023-11-22 09:57:58 425KB 研究论文
1
给定参考信号的样本块和所需信号的样本块,该函数更新滤波器权重并返回误差样本块。
2023-10-16 16:17:29 1KB matlab
1
交直流潮流计算程序,交替迭代法,带界面设计,提供一个11节点算例 AC / DC power flow calculation program, alternating iteration method, with interface design, provides an 11 node example
2023-08-10 13:40:01 33KB matlab 开发语言
在联合冲击滤波器和非线性各向异性扩散滤波器对含噪图像做预处理的基础上,利用边缘检测算子选取自适应参数,构建能同时兼顾图像平滑去噪与边缘保留的自适应全变分模型,并基于Bregman迭代正则化方法设计了其快速迭代求解算法。实验结果表明,自适应去噪模型及其求解算法在快速去除噪声的同时保留了图像的边缘轮廓和纹理等细节信息,得到的复原图像在客观评价标准和主观视觉效果方面均有所提高。
1
详细介绍了流体力学中的有限元方法及其快速迭代技术,针对流体方程开展方程离散化,并对形成的矩阵方程开展加速求解技术,该类方法为有限元在其他领域(电磁场、力学等)的应用提供了较好的借鉴。
2023-07-04 15:46:01 4.68MB FEM
1