离散控制Matlab代码马可夫决策过程 马尔可夫决策过程(MDP)是离散的时间随机控制过程。 它提供了一个数学框架,用于在结果部分随机且部分受决策者控制的情况下对决策建模。 MDP对于研究通过动态编程和强化学习解决的优化问题非常有用。 MDP至少早在1950年代就已为人所知;罗纳德·霍华德(Ronald Howard)于1960年出版的《动态编程和马尔可夫过程》是马尔可夫决策过程研究的核心内容,它们被用于许多领域,包括机器人技术,自动控制,经济学和制造业。 MDP的名称来自俄罗斯数学家Andrey Markov。 。 算法: 值迭代(Bellman 1957):也称为反向归纳,不使用π函数; 而是在需要时在V(s)内计算π(s)的值。 将π(s)的计算代入V(s)的计算可得出组合步骤。 在下面查看有关如何计算效用的示例(有关更多详细信息,请参见-中的代码)算法: 策略迭代:在策略迭代中(霍华德1960),第一步执行一次,然后重复第二步直到收敛。 然后,再次执行第一步,依此类推。 对于大量可能的状态,策略迭代通常比值迭代慢。 算法 : 注意:在此代码中,我们将不处理该算法(我们将在稍后发
2022-04-12 19:14:58 263KB 系统开源
1
幻方,有时又称魔方(该称呼现一般指立方体的魔术方块)或纵横图,由一组排放在正方形中的整数组成,其每行、每列以及两条对角线上的数之和均相等。通常幻方由从1到N2的连续整数组成,其中N为正方形的行或列的数目。因此N阶幻方有N行N列,并且所填充的数为从1到N2。 里面有java的程序示例
2022-04-02 00:19:32 27KB 幻方 九宫格 纵横图
1
智能优化算法:其中包含遗传算法、蚁群算法、模拟退火算法、差分进化算法等以及一些代码
1
这几天把EM算法(Expectation Maxinum)反复琢磨了几遍,经过几次讨论,对EM算法的数学模型有了比较深入的理解。考虑到: 1. 这个算法在Machine Learning中极其重要,也是进行Machine Learning深入研究的一个重要阶梯 2. 这个算法确实需要一定的概率和数学基础 3. 中文或翻译的教材似乎没有很好的解释清楚这个算法 于是我根据Pattern Recogition and Machine Learning一书相关章节的内容,结合自己的理解,写了一套中文的EM算法介绍和分析。又混合高斯模型开始,由浅入深,逐步讲解了EM算法在混合高斯模型应用和一般化描述。自己感觉还是比较容易理解的。 如果发现pdf中有什么问题,或有什么错误,请直接与我联系,欢迎讨论。 要下载最新的版本请到http://glatteis.spaces.live.com
2022-02-26 22:44:00 668KB EM GMM 期望最大 混合高斯分布
1
层次聚类:层次聚类 划分聚类法:Kmeans算法 基于密度的聚类:DBSCAN的概念
2022-02-17 17:03:34 238KB 聚类算法 聚类
1
(2)矩阵换位法 把明文中的字母按给定的顺序安排在一矩阵中,然后用另一种顺序选出矩阵的字母来产生密文。
1
金蝶HR产品培训—系统内置公式函数算法介绍.zip
2022-01-15 14:02:14 1.52MB 互联网
资料将目前常见/所有的深度学习优化器算法进行汇总描述,并从宏观上对所有算法进行对比分析。可为对优化器的全面了解提供辅助作用,对优化器的选用也有辅助作用。
2021-12-27 01:07:36 583KB 深度学习 优化器 详述与对比分析
1
VRP算法分类 扫描算法(1974) k-opt算法 -interchange算法 蚁群算法 (1991,2003) 两阶段算法(1979) 粒子群算法 (1995) Constructive heuristics gradually builds a feasible solution while keeping an eye on solution cost, but do not contain an improvement phase per se. (Laporte and Semet[2002]). 精确算法 启发式算法 分枝界定法 割平面法 网络流算法 动态规划法 构造启发式算法 改进启发式算法 亚启发式算法 最邻近法(1977) 最近插入法(1976) 禁忌搜索法 (1986,1991) C-W节约法(1964) 遗传算法 (1975,1996) 神经网络算法 (1943,2000) 模拟退火法 (1953,1993)
2021-12-24 18:34:59 1.39MB VRP
1
λ-interchange算法
2021-12-20 21:15:50 1.39MB VRP
1