只为小站
首页
域名查询
文件下载
登录
求解部分可观测
马氏决策
过程的强化学习算法
针对部分可观测
马氏决策
过程(POMDP) 中, 由于感知混淆现象的存在, 利用Sarsa 等算法得到的无记忆策 略可能发生振荡的现象, 研究了一种基于记忆的强化学习算法——CPnSarsa (K) 学习算法来解决该问题. 它通过重新 定义状态,A gent 结合观测历史来识别混淆状态. 将CPnSarsa (K) 算法应用到一些典型的POMDP, 最后得到的是最 优或近似最优策略. 与以往算法相比, 该算法的收敛速度有了很大提高.
2021-06-25 14:28:18
339KB
强化学习 部分可观测M
arkov
决策过程 Sarsa
学习 无记忆策略
1
马尔可夫决策过程引论
马氏决策
的好书,可用于Internet流量分析建模,无线网络资源分配建模
2019-12-21 19:35:18
6.05MB
马氏决策
1
个人信息
点我去登录
购买积分
下载历史
恢复订单
热门下载
DirectX修复工具V4.1增强版
Vivado license 永久
基于Matlab的IEEE14节点潮流计算.zip
基于matlab扩频通信系统仿真(整套代码)
西门子逻辑控制设计开发_3部10层
基于傅里叶算子的手势识别的完整源代码(Python实现,包含样本库)
IBM.ILOG.CPLEX.Enterprise.Server.v12.10.0.Win64.rar CPLEX下载
java-spring-web-外文文献翻译40篇.zip
MAC OS.X.10.8.iso 镜像文件
Plexim Plecs Standalone 4.1.2 x64.7z
Vivado永久激活license(亲测可用)包(搜集的全部可用LICENSE)
凯斯西储大学(CWRU)轴承数据集(含数据包+整理Python程序+使用说明)
Monet智能交通场景应用
基于javaweb的网上购物系统(毕业论文+答辩PPT+开题报告+源代码)
雷达信号处理仿真程序(MTI,MTD等)
最新下载
2022NFT开发平台数字藏品开发平台源码
人员信息表(Power BI练习数据集).xlsx
机器翻译translation2019zh.zip
VT8601 WIN98 驱动
鼎捷T100全套操作手册.rar
VisendoSMTPExtender_plus_x64.zip
最佳滤波(原书optimal filter 中文版)
EtherCAT 从站 C语言 PDO动态映射参考代码
WINCE记事本软件
多目标优化算法(二)MOEAD(附带NSGA2)的文档和代码(MATLAB)
其他资源
discuz论坛插件DZ插件 万能表单报名系统 V1.0.2
IFC模型(商住楼,三层别墅,人性化办公楼模型).rar
数据结构与算法学习辅导及习题详解.张乃孝版
gan简单代码实现python
三个水壶水壶问题(广度优先java实现)
libmysql.dll
opencv_python-3.4.0-cp36-cp36m-win_amd64.whl OpenCV的python安装包下载
QT 多页翻页方案实现方式
vue-自动适配手机后台管理系统全.zip
Togaf 9 鉴定级 真题题库1(含答案)
解决opencv3.2 OpenCVUtils.cmake:1047错误
Normal (aka Gaussian) distribution 正态分布 高斯分布算法 C#
全栈网络应用4-源码
MATLAB工具箱大全-数字图像处理工具箱DIPUM Toolbax V1.1.3
squeezy:一种命令行实用程序,用于通过其squeezeserver控制squeezebox网络音频播放器-源码
卫星导航系统中恒包络复用算法的研究
qt-vsaddin-msvc2017-2.6.0-rev.07.vsix.7z
Javaweb课程设计
NGUI多个版本合集
android-mail.jar
C语言贪吃蛇【图形库版】
奇偶校验C语言原码
Asp.net动态生成Word文档并填充数据