只为小站
首页
域名查询
文件下载
登录
求解部分可观测马氏决策过程的强化学习算法
针对部分可观测马氏决策过程(POMDP) 中, 由于感知混淆现象的存在, 利用Sarsa 等算法得到的无记忆策 略可能发生振荡的现象, 研究了一种基于记忆的强化学习算法——CPnSarsa (K) 学习算法来解决该问题. 它通过重新 定义状态,A gent 结合观测历史来识别混淆状态. 将CPnSarsa (K) 算法应用到一些典型的POMDP, 最后得到的是最 优或近似最优策略. 与以往算法相比, 该算法的收敛速度有了很大提高.
2021-06-25 14:28:18
339KB
强化学习 部分可观测M
arkov
决策过程 Sarsa
学习 无记忆策略
1
个人信息
点我去登录
购买积分
下载历史
恢复订单
热门下载
基于YOLOV5的车牌定位和识别源码.zip
大学生网页设计大作业-5个网页设计制作作品自己任选
2019年秋招—华为硬件工程师笔试题目.pdf
DS证据理论的MATLAB案例程序源代码
OLED显示温度和时间-STM32F103C8T6(完整程序工程+原理图+相关资料).zip
MPC 模型预测控制matlab仿真程序
狂神说Java系列笔记.rar
cublas64_11.dll cublasLt64_11.dll cusolver64_11.dll
QT自制精美Ui模板系列(一)桃子风格模板 - 二次开发专用
CUDA并行程序设计 GPU编程指南-中文扫描539页完整版pdf+高质量英文完整591页原版非扫描pdf
EEupdate_5.35.12.0 win10下修改intel网卡mac
20200318附加-2019年电赛综合测评方案详细计算过程(pdf版本,有朋友反映word版本乱码,特意转为pdf)
token登录器.rar
Spring相关的外文文献和翻译(毕设论文必备)
2020年数学建模B题穿越沙漠全部代码全国赛二等奖.zip
最新下载
国际10-20系统脑电极分布VISO图图.vsdx
校园导游系统课程设计报告
千分尺 螺旋测微器 flash动画
ROSE mirror HA 双机热备软件
魂斗罗素材
国开《计算机绘图》课程形考1-4 .dwg答案(可直接使用)
DS18B20温度采集+串口发送+模块化编程 51单片机
Plex v7.12电视端app
IBM CPLEX 12.10 学术版 mac操作系统安装包
ADC参数测试资料&matlab源程序
其他资源
游戏策划如何入门----最经典的游戏数值设计策划案
条形码批量生成打印程序(VB制作,含源代码)
量子物理学中的常用算法与程序
Si基相控阵技术的相关进展参考文献
Java调用Labview生成的DLL文件
ISO 14229-1:2013
2017全国数学建模竞赛获奖论文
某宝两万多买的王者荣耀素材
直流电机双闭环控制
各类报警主机编程
typora-x64.zip
基于PEMWE的光伏氢能生产系统的性能分析
simple-p5js-游戏-源码
MATLAB工具箱大全- 量子波函数演示工具箱
汽车营销原理与应用课件.ppt
典型FPGA实例 SDRAM读写控制的实现与Modelsim仿真
checkpoint的snmp及syslog配置.doc
企业级K8S可用安装教程.docx
LPC2132 串口程序
asp.net在线通讯录系统
flash判断旋转矩形是否相交
java-jdk源代码免费分享 src.zip
vdexExtractor.zip
历史上飞机坠毁数据集
qt 5 天气预报