实用马尔可夫决策过程 对于智能规划的学习有很大的帮助
2021-12-15 19:50:34 2.86MB 实用马尔可夫决策过程 刘克著
1
Matlab代码移植基于马尔可夫决策过程的移动边缘计算中的动态服务迁移 这是S. Wang,R. Urgaonkar,M. Zafer,T. He,K. Chan,Leung KK Leung的仿真代码,“基于Markov决策过程的移动边缘计算中的动态服务迁移”,IEEE / ACM。关于网络,第一卷。 27号3,第1272至1288页,2019年6月。(arXiv链接:) 该代码在MATLAB上运行效果最佳。 它也可以继续运行,但是瞬时成本图可能会以较低的粒度显示。 要重现随机游走结果(本文的图6),请运行mainRandomWalk.m 。 要使用实际基站位置来再现结果(本文的图8),请运行mainRealCellLocation.m 。 mainRandomWalk.m和mainRealCellLocation.m中的某些参数可以针对不同的实验进行更改。 主算法中实现algorithms.m被称为内mainRandomWalk.m和mainRealCellLocation.m 。 从获得真实用户跟踪,从获得基站位置。 它们保存在traceRealCellLocations.mat
2021-10-29 17:27:43 968KB 系统开源
1
mdp-迷宫 Python 中的马尔可夫决策过程实现。
2021-10-13 19:11:41 124KB JavaScript
1
lpc matlab代码 :mountain: 马尔可夫决策过程的值迭代算法 该存储库的内容作为计算机科学理学硕士课程的学生要求的概率图形模型课程的一项分配项目。 这段代码的版本中提供的所有资源都是从您可以在参考部分找到的类书中获得的。 算法和信息的这种应用仅用于教育目的 描述: 实现值迭代算法以解决离散的马尔可夫决策过程。 教授: 博士 参与的学生: 马里奥·德·洛斯·桑托斯(Mario De Los Santos)。 Github :。 电子邮件: 指示 下载存储库的文件 验证C ++版本是否至少为C ++ 14 调用文档中标记的功能 以下算法基于教授提供的文档。 用作参考的书位于此文件的末尾。 值迭代算法包括根据Bellman方程迭代地估计每个状态s的值。 下图显示了用于创建该项目的伪代码。 Policy迭代算法由基于Bellman方程迭代地估算每个状态s的值组成,主要区别在于我们将Policy存储在每次迭代中,这将使我们可以将迭代(t)与(t-1)进行比较),那么如果政策相同,则我们将完成该过程,这将以存储成本为您带来计算速度上的优势。 图像2显示了用于创建该项目的伪代码。 示例需要调用该类,如
2021-10-07 17:56:24 929KB 系统开源
1
MDP-DP-RL 该项目的目标是从头开始开发所有动态编程和强化学习算法(即,除了基本的numpy和scipy工具之外,不使用标准库)。 “从头开始开发”目标是出于教育目的-学习此主题的学生只有在他们开发和使用从头开始开发的代码时才能彻底理解这些概念。 我针对不同的学生背景讲授了该主题的课程,每门此类课程都以技巧/算法的精确编程实现为基础。 特别是,当我教Stanford CME 241:金融中的随机控制问题的强化学习( )时,会使用此代码库。 关于代码可读性,性能和错误的任何反馈将不胜感激,因为代码仍相当原始且未经各个部分的测试(2018年8月开始使用此代码,到目前为止主要处于代码增长模式)。 该项目开始于为有限的马尔可夫过程(又名马尔可夫链),马尔可夫奖励过程(MRP)和马尔可夫决策过程(MDP)实现基础数据结构。 其次是动态编程(DP)算法,其重点是在代码内以清晰的数学术语表
2021-10-04 12:17:47 148KB Python
1
mdp(马尔可夫决策过程)2009年matlab源码,非常详细全面,非常实用
2021-10-03 19:50:32 240KB matlab
1
研究供需不平衡环境下的应急物资动态分配问题.考虑到台风灾害演变导致应急物资需求不断增长与应急物资供应相对紧缺之间的矛盾,将需求的演变设计成一个马尔可夫决策过程,建立基于马尔可夫决策的应急物资动态分配模型.通过二进制粒子群优化算法求解,最后将所提出模型应用于某台风发生时的救灾实例.实例分析表明,马尔可夫决策方法可以动态地做出合适的需求扑灭策略,使得整体的需求演变趋势保持平稳,整体的需求水平降到最低.
1
2009年写的matlab mdp源码,里面有全部的英文document介绍说明 2009年写的matlab mdp源码,里面有全部的英文document介绍说明
2021-09-07 14:54:41 225KB matlab mdp 源码 实现
1
中文版的MDP详细讲解,包括公式的完整推导过程,内容详细,通俗易懂,是学习MDP和强化学习难得的参考资料。
2021-08-26 16:45:05 1.68MB 马尔科夫决策过程 强化学习
1
POMDP:基于部分可观察的马尔可夫决策过程实现RL算法
1