只为小站
首页
域名查询
文件下载
登录
求解部分可观测
马氏决策
过程的强化学习算法
针对部分可观测
马氏决策
过程(POMDP) 中, 由于感知混淆现象的存在, 利用Sarsa 等算法得到的无记忆策 略可能发生振荡的现象, 研究了一种基于记忆的强化学习算法——CPnSarsa (K) 学习算法来解决该问题. 它通过重新 定义状态,A gent 结合观测历史来识别混淆状态. 将CPnSarsa (K) 算法应用到一些典型的POMDP, 最后得到的是最 优或近似最优策略. 与以往算法相比, 该算法的收敛速度有了很大提高.
2021-06-25 14:28:18
339KB
强化学习 部分可观测M
arkov
决策过程 Sarsa
学习 无记忆策略
1
马尔可夫决策过程引论
马氏决策
的好书,可用于Internet流量分析建模,无线网络资源分配建模
2019-12-21 19:35:18
6.05MB
马氏决策
1
个人信息
点我去登录
购买积分
下载历史
恢复订单
热门下载
matlab机器人工具箱实现机械臂直线轨迹&圆弧轨迹规划
DS证据理论的MATLAB案例程序源代码
基于MATLAB的水果图像识别
CUDA并行程序设计 GPU编程指南-中文扫描539页完整版pdf+高质量英文完整591页原版非扫描pdf
基于MATLAB的Filter使用,低通、带通和高通滤波器的仿真
中国地面气候资料日值数据集(V3.0)-201001201912.rar
JPEG的Matlab实现
CPLEX12.8学术版安装包:cplex_studio128.win-x86-64.exe
银行笔试 信息科技岗部分真题
多目标优化算法(四)NSGA3的代码(MATLAB)
Android小项目——新闻APP(源码)
(推荐)小爱触屏音箱LX04_2.34.5-官改-(开发版)SP5
PLECS中文手册.pdf
MTALAB NSGA2算法
刚萨雷斯《数字图像处理》第四版答案.pdf
最新下载
富勒wms产品功能说明书
【亲测可用】dbForge Studio 2022 for Oracle Enterprise 4.4.49【2月最新版本】
SAP中文手册:仓库管理
空心线圈和磁芯线圈电感计算工具
(MATLAB代码精讲、实际工程经验分享)改进的遗传算法求解带约束的优化问题(通用)
使用STM32CubeMX配置HX711压力传感器模块串口输出数据并屏幕显示(HAL库)
QT+VS点击按钮弹出新窗口的实现
汇编—人名排序程序的实现
Java设计模式之23种设计模式详解
Matlab Simulink三维图形显示模块
其他资源
基于esp8266的wifi deauther项目及解决方案和部分arduino库
世界各国和城市shp.zip
jspweb课程设计—网上商城.zip
javaee 实现网上商城
MiBOX2_2S_dredd_gitv_1.3.112d.2199.zip
外文文献及翻译《JSP应用框架》
20王道考研408操作系统.pdf
Java的内存回收
vue.js pdf
Canon UFRII_Driver_V2175_W64 打印机驱动.zip
c++经典代码大全.pdf
AI+高等教育发展与应用白皮书-百度+国家开放大学-2020.8-102页.pdf
TexturePacker Importer.unitypackage
Switch-Fightstick:Nintendo Switch的自动操作-源码
jupyterlab_language_pack_zh_CN-0.0.1.dev0-py2.py3-none-any.whl
水准处理软件.rar
PID参数调整
VMware中CentOS 7设置固定IP同时连接内外网.doc
AR过程的线性建模过程与各种功率谱估计算法之间比较
FIR滤波器的MATLAB及FPGA实现代码
c++ 本地机子流量统计
基于DDS的三相正弦波发生器
订货系统ASP
json转csv的exe软件