只为小站
首页
域名查询
文件下载
登录
实用
马尔可夫决策
过程 高清版
实用
马尔可夫决策
过程 对于智能规划的学习有很大的帮助
2021-12-15 19:50:34
2.86MB
实用马尔可夫决策过程
刘克著
1
matlab代码移植-service-migration-mdp:论文代码“基于
马尔可夫决策
过程的移动边缘计算中的动态服务迁移”
Matlab代码移植基于
马尔可夫决策
过程的移动边缘计算中的动态服务迁移 这是S. Wang,R. Urgaonkar,M. Zafer,T. He,K. Chan,Leung KK Leung的仿真代码,“基于Markov决策过程的移动边缘计算中的动态服务迁移”,IEEE / ACM。关于网络,第一卷。 27号3,第1272至1288页,2019年6月。(arXiv链接:) 该代码在MATLAB上运行效果最佳。 它也可以继续运行,但是瞬时成本图可能会以较低的粒度显示。 要重现随机游走结果(本文的图6),请运行mainRandomWalk.m 。 要使用实际基站位置来再现结果(本文的图8),请运行mainRealCellLocation.m 。 mainRandomWalk.m和mainRealCellLocation.m中的某些参数可以针对不同的实验进行更改。 主算法中实现algorithms.m被称为内mainRandomWalk.m和mainRealCellLocation.m 。 从获得真实用户跟踪,从获得基站位置。 它们保存在traceRealCellLocations.mat
2021-10-29 17:27:43
968KB
系统开源
1
mdp-maze:Python 中的
马尔可夫决策
过程实现-源码
mdp-迷宫 Python 中的
马尔可夫决策
过程实现。
2021-10-13 19:11:41
124KB
JavaScript
1
lpcmatlab代码-MDPs_Value-Iteration:
马尔可夫决策
过程的值迭代算法
lpc matlab代码 :mountain:
马尔可夫决策
过程的值迭代算法 该存储库的内容作为计算机科学理学硕士课程的学生要求的概率图形模型课程的一项分配项目。 这段代码的版本中提供的所有资源都是从您可以在参考部分找到的类书中获得的。 算法和信息的这种应用仅用于教育目的 描述: 实现值迭代算法以解决离散的
马尔可夫决策
过程。 教授: 博士 参与的学生: 马里奥·德·洛斯·桑托斯(Mario De Los Santos)。 Github :。 电子邮件: 指示 下载存储库的文件 验证C ++版本是否至少为C ++ 14 调用文档中标记的功能 以下算法基于教授提供的文档。 用作参考的书位于此文件的末尾。 值迭代算法包括根据Bellman方程迭代地估计每个状态s的值。 下图显示了用于创建该项目的伪代码。 Policy迭代算法由基于Bellman方程迭代地估算每个状态s的值组成,主要区别在于我们将Policy存储在每次迭代中,这将使我们可以将迭代(t)与(t-1)进行比较),那么如果政策相同,则我们将完成该过程,这将以存储成本为您带来计算速度上的优势。 图像2显示了用于创建该项目的伪代码。 示例需要调用该类,如
2021-10-07 17:56:24
929KB
系统开源
1
MDP-DP-RL:
马尔可夫决策
过程,动态规划和强化学习-源码
MDP-DP-RL 该项目的目标是从头开始开发所有动态编程和强化学习算法(即,除了基本的numpy和scipy工具之外,不使用标准库)。 “从头开始开发”目标是出于教育目的-学习此主题的学生只有在他们开发和使用从头开始开发的代码时才能彻底理解这些概念。 我针对不同的学生背景讲授了该主题的课程,每门此类课程都以技巧/算法的精确编程实现为基础。 特别是,当我教Stanford CME 241:金融中的随机控制问题的强化学习( )时,会使用此代码库。 关于代码可读性,性能和错误的任何反馈将不胜感激,因为代码仍相当原始且未经各个部分的测试(2018年8月开始使用此代码,到目前为止主要处于代码增长模式)。 该项目开始于为有限的马尔可夫过程(又名马尔可夫链),马尔可夫奖励过程(MRP)和
马尔可夫决策
过程(MDP)实现基础数据结构。 其次是动态编程(DP)算法,其重点是在代码内以清晰的数学术语表
2021-10-04 12:17:47
148KB
Python
1
mdp(
马尔可夫决策
过程)2009年matlab源码,非常详细全面,非常实用
mdp(
马尔可夫决策
过程)2009年matlab源码,非常详细全面,非常实用
2021-10-03 19:50:32
240KB
matlab
1
基于
马尔可夫决策
的应急物资动态分配模型
研究供需不平衡环境下的应急物资动态分配问题.考虑到台风灾害演变导致应急物资需求不断增长与应急物资供应相对紧缺之间的矛盾,将需求的演变设计成一个
马尔可夫决策
过程,建立基于
马尔可夫决策
的应急物资动态分配模型.通过二进制粒子群优化算法求解,最后将所提出模型应用于某台风发生时的救灾实例.实例分析表明,
马尔可夫决策
方法可以动态地做出合适的需求扑灭策略,使得整体的需求演变趋势保持平稳,整体的需求水平降到最低.
2021-09-30 11:51:14
318KB
应急物流 物资分配 台风灾害 马尔可夫决策 粒子群算法
1
mdp(
马尔可夫决策
过程)2009年matlab源码,非常详细全面,非常实用
2009年写的matlab mdp源码,里面有全部的英文document介绍说明 2009年写的matlab mdp源码,里面有全部的英文document介绍说明
2021-09-07 14:54:41
225KB
matlab
mdp
源码
实现
1
马尔可夫决策
过程实例讲解.pdf
中文版的MDP详细讲解,包括公式的完整推导过程,内容详细,通俗易懂,是学习MDP和强化学习难得的参考资料。
2021-08-26 16:45:05
1.68MB
马尔科夫决策过程
强化学习
1
POMDP:基于部分可观察的
马尔可夫决策
过程实现RL算法-源码
POMDP:基于部分可观察的
马尔可夫决策
过程实现RL算法
2021-08-18 20:46:53
165KB
reinforcement-learning
matlab
neuroscience
reinforcement-learning-algorithms
1
个人信息
点我去登录
购买积分
下载历史
恢复订单
热门下载
校园网规划与设计(报告和pkt文件)
PowerBI视觉对象共计271组,更新日期2021.01.20日.zip
cplex_studio129.win-x86-64.exe CPLEX 12.9直接安装可使用
基于STM32的FFT频谱分析+波形识别
2022学术英语写作(东南大学) 章节测试+期末test答案
知网情感词典(HOWNET)
Elsevier爱思唯尔的word模板.zip
java-spring-web-外文文献翻译40篇.zip
画程(版本6.0.0.127)setup个人版
Monet智能交通场景应用
IBM.ILOG.CPLEX.Enterprise.Server.v12.10.0.Win64.rar CPLEX下载
拾荒者.exe同时ID扫描器IP扫描器
android开发期末大作业.zip
JPEG的Matlab实现
token登录器.rar
最新下载
溪谷游戏联运系统加盟版-v1.1安装包-免费下载使用
创建一个移动无线网络-OPNET使用入门
Communications Toolbox Support Package for USRP Radio.rar
变压器与电感器设计手册-第四版(中文).pdf
DS918+6.21二合一硬盘镜像(完美运行,主板必须改为UEFI).7z
RabbitMQ_Windows.rar
Marvell 88NV1120-B0KB.zip
爱威A9+说明书
Modelsim 10.1c
GusActivatorPRO A12+ Special Edition V2.1 Windows
其他资源
IC卡数据分析工具.exe
MATLAB CIC滤波器仿真
Verilog.HDL高级数字设计.2nd.zip
grbl运动控制源代码+中文注释
异构信息网络挖掘原理与方法.pdf
ABB机器人CF卡安装系统
电动汽车整车实车控制模型
java+JSP课程设计6套系统源代码
5G射频前端芯片行业报告:全景图(117页).zip
echarts完整版
ET199加密狗读写工具
markdown编辑器简单使用.md
raw-connect:具有Polkadot JS WasmProvider实现的基板Wasm客户端的原始模板-源码
文化产业概论的拓展学习资料.pdf
mr-ui:Metamn React UI组件-源码
rollSlide-demo.zip
量纲分析与物理新发现_赵金土.pdf
pdf.js&pdf;.worker.js
改进的denaulay三角网渐次插入生成算法
c#银行系统全套,带后台
作业提交系统
Android记账源代码
程序员的数学三书包括《程序员的数学》《程序员的数学2:概率统计》《程序员的数学3:线性代数》-机器学习文档类资源
cplex教程中文翻译
虚拟USB共享USB OVER NETWORK 5.0.2WIN平台 有注册码
Nagios源码 和中文帮助文档