只为小站
首页
域名查询
文件下载
登录
论文研究 -
连续时间马尔可夫决策过程
的方差优化
本文考虑了
连续时间马尔可夫决策过程
中平均报酬的方差优化问题。 假设状态空间是可计数的,而动作空间是Borel可测量的空间。 本文的主要目的是在确定性平稳策略空间中找到方差最小的策略。 与传统的马尔可夫决策过程不同,方差准则中的成本函数将受到未来行动的影响。 为此,我们通过引入称为伪方差的概念将方差最小化问题转换为标准(MDP)。 通过给出伪方差优化问题的策略迭代算法,推导了原始方差优化问题的最优策略,并给出了方差最优策略的充分条件。 最后,我们用一个例子来说明本文的结论。
2024-01-10 23:19:32
398KB
连续时间马尔可夫决策过程
策略迭代
1
个人信息
点我去登录
购买积分
下载历史
恢复订单
热门下载
STM32F4时钟触发ADC双通道采样DMA传输进行FFT+测频率+采样频率可变+显示波形
matlab时频分析工具箱+安装方法+函数说明+最新版tftb.
Monet智能交通场景应用
风电场风速及功率数据.zip
PowerBI视觉对象共计271组,更新日期2021.01.20日.zip
MVDR,Capon波束形成DO估计.zip
PSO-LSSVM的MATLAB代码.rar
多智能体的编队控制matlab程序(自己编写的,可以运行)
EEMD算法应用于信号去噪.rar
MPC 模型预测控制matlab仿真程序
Vivado license 永久
基于MATLAB的Filter使用,低通、带通和高通滤波器的仿真
房价预测的BP神经网络实现_python代码
EBSD分析软件——Channel5下载安装教程
校园网规划与设计(报告和pkt文件)
最新下载
掌讯导航8217/8227/8230/8237,导航升级包
lx86说明书
中国地面气候资料日值数据集(V3.0)2014-2019.zip
先锋VSX-821-K中文说明书
AZdecrypt 1.19.zip
华为E5375解锁三网五模固件及附相应教程
MSC.ADAMS 技术与工程分析实例
ESRI-Licensing文件夹,安装arcgispro无法破解登录
STM32开发板(德飞莱)尼莫M3S系列实例程序
MA5822空库文件,可以重置登录密码
其他资源
深度学习讲座
k均值聚类算法MATLAB程序及注释
(代码)MATLAB摄像头实时图像处理
吉林大学陈虹教授预测控制
统计实验及R语言模拟
python3实现RSA(非调用RSA库)
easyscada下载
java+access+swing图书管理系统
swagger技术分享ppt
全球编程大赛作品,拍摄月亮 3.98K.rar
状态::chart_increasing:正常运行时间监控器和状态页面-源码
Axure 各种有趣的效果图.zip
【ssm项目源码】企业人事管理系统.zip
frp_0.33.0_linux_amd64.tar.gz
遥感图像处理的步骤
C#编写的小游戏贪吃蛇源码
远程视频视频监控源程序(C++实现)
基于TCP传输文件及文件夹的LabVIEW程序
C++写的SIS疾病传播模型模拟
c和c++库函数快速查询资料
基于FPGA的高频PWM开关电源控制器设计