只为小站
首页
域名查询
文件下载
登录
求解部分可观测马氏决策过程的强化学习算法
针对部分可观测马氏决策过程(POMDP) 中, 由于感知混淆现象的存在, 利用Sarsa 等算法得到的无记忆策 略可能发生振荡的现象, 研究了一种基于记忆的强化学习算法——CPnSarsa (K) 学习算法来解决该问题. 它通过重新 定义状态,A gent 结合观测历史来识别混淆状态. 将CPnSarsa (K) 算法应用到一些典型的POMDP, 最后得到的是最 优或近似最优策略. 与以往算法相比, 该算法的收敛速度有了很大提高.
2021-06-25 14:28:18
339KB
强化学习 部分可观测M
arkov
决策过程 Sarsa
学习 无记忆策略
1
个人信息
点我去登录
购买积分
下载历史
恢复订单
热门下载
基于MATLAB的Filter使用,低通、带通和高通滤波器的仿真
DBSCAN算法Matlab实现
基于FPGA的DDS信号发生器设计(频率、幅度、波形可调)
scratch版 我的世界.sb2
《MIMO-OFDM无线通信技术及MATLAB实现》高清PDF及源代码
基于javaweb的网上购物系统(毕业论文+答辩PPT+开题报告+源代码)
华为OD机试真题.pdf
PowerBI视觉对象共计271组,更新日期2021.01.20日.zip
故障诊断数据集及实现代码
商用密码应用与安全性评估——霍炜.pdf
java-spring-web-外文文献翻译40篇.zip
2010年-2020中国地面气候资料数据集(V3.0)
Vivado license 永久
数据结构课后习题答案
中国地面气候资料日值数据集(V3.0)2010-2019.rar
最新下载
模电数电做的四人抢答器有详细电路图及说明
Wireshark-win32-2.4.3.0 破解版
正点原子 FPGA代码
DayinCMS 3D模型管理系统 v1.3
计算机二级考试python试题考前模拟12套卷.zip
HC-05 蓝牙模块 原理图 PCB 及指令说明
中异广告企业管理系统标准版8.5.0破解版
Focaltech_Touch_FT6236U_Driver_for_MTK_V3.0a_20180929.rar
AMD-APP-SDKInstaller-v3.0.130.135-GA-windows-F-x64.exe
deblurGAN V2预训练模型.zip
其他资源
从应用到创新 手机硬件研发与设计 第2版.pdf
基于物品的协同过滤算法itemCF原理及python代码实现
android开发日程管理系统(含源码)
DCO_OFDM程序代码
miniblink c++ qt 浏览器
CSE-CIC-IDS2018 加拿大入侵检测数据集 Friday数据
jdk-7u67-linux-x64.tar.gz
Android开发丶二级列表的联动功能实现
东南大学研究生课程课件---计算机网络体系结构.rar
基于django的网页倒计时
电子设计指南 孙肖子.pdf
中国城市统计年鉴2019(地级市).xlsx
网易新闻apicloud源码
租车管理系统源码
hdfsFile.zip, windows下调试hadoop,.hdfs的2个文件hadoop.dll,winutils.exe
100G DWDM光模块中的PAM4与相干技术
漂亮的jsp页面
sprz05.github.io-源码
GoStack11-conceitos-front.end-React.Native:Primeiro项目与React Native的概念-源码
带CRC校验的串口工具
Sun V480/V490更改rsc密码的工具包
移动机器人lissajous曲线轨迹跟踪
51单片机寄存器详解
kmeans中文文本聚类java源码(包括对文本tf,idf的计算,文本相似度计算)
fckeditor 2.3 兼容chrome解Number转换异常