Matlab代码移植基于马尔可夫决策过程的移动边缘计算中的动态服务迁移 这是S. Wang,R. Urgaonkar,M. Zafer,T. He,K. Chan,Leung KK Leung的仿真代码,“基于Markov决策过程的移动边缘计算中的动态服务迁移”,IEEE / ACM。关于网络,第一卷。 27号3,第1272至1288页,2019年6月。(arXiv链接:) 该代码在MATLAB上运行效果最佳。 它也可以继续运行,但是瞬时成本图可能会以较低的粒度显示。 要重现随机游走结果(本文的图6),请运行mainRandomWalk.m 。 要使用实际基站位置来再现结果(本文的图8),请运行mainRealCellLocation.m 。 mainRandomWalk.m和mainRealCellLocation.m中的某些参数可以针对不同的实验进行更改。 主算法中实现algorithms.m被称为内mainRandomWalk.m和mainRealCellLocation.m 。 从获得真实用户跟踪,从获得基站位置。 它们保存在traceRealCellLocations.mat
2021-10-29 17:27:43 968KB 系统开源
1
mdp-迷宫 Python 中的马尔可夫决策过程实现。
2021-10-13 19:11:41 124KB JavaScript
1
MDP-DP-RL 该项目的目标是从头开始开发所有动态编程和强化学习算法(即,除了基本的numpy和scipy工具之外,不使用标准库)。 “从头开始开发”目标是出于教育目的-学习此主题的学生只有在他们开发和使用从头开始开发的代码时才能彻底理解这些概念。 我针对不同的学生背景讲授了该主题的课程,每门此类课程都以技巧/算法的精确编程实现为基础。 特别是,当我教Stanford CME 241:金融中的随机控制问题的强化学习( )时,会使用此代码库。 关于代码可读性,性能和错误的任何反馈将不胜感激,因为代码仍相当原始且未经各个部分的测试(2018年8月开始使用此代码,到目前为止主要处于代码增长模式)。 该项目开始于为有限的马尔可夫过程(又名马尔可夫链),马尔可夫奖励过程(MRP)和马尔可夫决策过程(MDP)实现基础数据结构。 其次是动态编程(DP)算法,其重点是在代码内以清晰的数学术语表
2021-10-04 12:17:47 148KB Python
1
mdp(马尔可夫决策过程)2009年matlab源码,非常详细全面,非常实用
2021-10-03 19:50:32 240KB matlab
1
2009年写的matlab mdp源码,里面有全部的英文document介绍说明 2009年写的matlab mdp源码,里面有全部的英文document介绍说明
2021-09-07 14:54:41 225KB matlab mdp 源码 实现
1
2009年写的matlab mdp源码,里面有全部的英文document介绍说明
2021-08-13 11:46:39 225KB matlab mdp 源码 实现
1
NASA软件缺陷CleanedData.zip
2021-07-05 20:06:12 1.47MB MDP
1
2009年写的matlab mdp源码,里面有全部的英文document介绍说明
2021-06-22 17:11:23 225KB matlab mdp 源码 实现
1
马尔可夫决策过程 (MDP) 工具箱
2021-06-10 16:02:52 984KB matlab 人工智能
1