只为小站
首页
域名查询
文件下载
登录
论文研究 -
连续时间马尔可夫决策过程
的方差优化
本文考虑了
连续时间马尔可夫决策过程
中平均报酬的方差优化问题。 假设状态空间是可计数的,而动作空间是Borel可测量的空间。 本文的主要目的是在确定性平稳策略空间中找到方差最小的策略。 与传统的马尔可夫决策过程不同,方差准则中的成本函数将受到未来行动的影响。 为此,我们通过引入称为伪方差的概念将方差最小化问题转换为标准(MDP)。 通过给出伪方差优化问题的策略迭代算法,推导了原始方差优化问题的最优策略,并给出了方差最优策略的充分条件。 最后,我们用一个例子来说明本文的结论。
2024-01-10 23:19:32
398KB
连续时间马尔可夫决策过程
策略迭代
1
个人信息
点我去登录
购买积分
下载历史
恢复订单
热门下载
王万良-人工智能导论(第五版)课件
Monet智能交通场景应用
画程(版本6.0.0.127)setup个人版
CUDA并行程序设计 GPU编程指南-中文扫描539页完整版pdf+高质量英文完整591页原版非扫描pdf
数字图像处理[冈萨雷斯]
MTALAB NSGA2算法
2020年数学建模B题(国二)论文.pdf
股票价格预测-LSTM-TCN-GBDT:使用四种算法(LSTM,TCN,GRU,GBDT)进行股票价格的预测和预测结果的检验。有四种算法(LSTM,TCN,GRU,GBDT)用于预测股价并检验预测结果-源码
IEEE 39节点系统的Simulink模型
中国地面气候资料日值数据集(V3.0)2010-2019.rar
elsevier 爱思唯尔 系列期刊的word模板,template,单栏,双栏
【SystemVerilog】路科验证V2学习笔记(全600页).pdf
Alternative A2DP Driver 1.0.5.1 无限制版
QT自制精美Ui模板系列(一)桃子风格模板 - 二次开发专用
工程伦理_李正风,丛杭青,王前_北京:清华大学出版社 , 2016.08_P329.pdf
最新下载
基于SSM框架+MySQL的超市订单管理系统【源码+文档+PPT】.zip
金盾加密 EXE lic提取脚本
宽带会话数限制检测工具
ABB ACS510 变频器中文使用说明书.pdf
怡趣X2投影仪固件 RK3128芯片方案
汽车电子EMC测试标准.rar
C#传递图片给C++处理的方法.zip
halcon八目拼接
半导体物理与器件(第三版)
中兴E8820 编程器固件
其他资源
在线web错题本
基于HOG和LBP的行人检测代码
MAX44009驱动STM32F4源码
虚拟电表软件 97表 很好用
程序员表白神器。安卓程序员表白软件。程序员追女友利器=android+雪花效果+彩色气泡+心形花园+心形玫瑰花
软件工程网上购物系统.doc
html5+css实现旅行网站
Numerical Methods for the Solution of Ill-Posed Problems
浪潮NF系列服务器raid+系统安装
全球国家城市数据xml列表
ETL工具Kettle最新完整操作手册带目录
MCloudMusic.rar
fourfront:数据门户,用于提交和查看基因组数据-源码
nginx.tar源码包
BuffetVsMonkeys:该程序证明了沃伦的假设:-源码
教你纯正的发音技巧.pdf
免部署的Windows 平台下的nginx-rtmp-win32 流媒体服务器
unity光线折射演示demo,配合博客理解
电脑销售 数据库课程设计
在线投票小程序java源代码
sqlite3 not found
java写的通讯录
sz rz 编译安装源码
加减乘除
Android个人消费记录理财软件(源码完整)
jfinal登录/注册;有验证码验证,可运行