只为小站
首页
域名查询
文件下载
登录
首页
开发技术
其它
随机清洁机器人的基于模型的值迭代算法:强化学习和动态规划(随机)的一个例子-matlab开发
随机清洁机器人的基于模型的值迭代算法:强化学习和动态规划(随机)的一个例子-matlab开发
上传者:
38627521
|
上传时间: 2021-09-17 17:03:41
|
文件大小: 3KB
|
文件类型: ZIP
matlab
随机清洁机器人的基于模型的值迭代算法。 这段代码是值迭代算法的一个非常简单的实现,对于强化学习和动态规划领域的初学者来说,它是一个有用的起点。 随机清洁机器人 MDP:清洁机器人必须收集用过的罐子,还必须为电池充电。 状态描述了机器人的位置,动作描述了运动的方向。 机器人可以向左或向右移动。 第一个 (0) 和最后 (5) 个状态是终止状态。 目标是找到一个最优策略,使任何初始状态的回报最大化。 这里是 Q-iteration(基于模型的值迭代 DP)。 参考:算法 2-2,来自: @book{busoniu2010reinforcement, title={使用函数逼近器的强化学习和动态规划}, 作者={Busoniu,Lucian 和 Babuska,Robert 和 De Schutter,Bart 和 Ernst,Damien}, 年={2010}, 出版商={CRC Press}
文件下载
立即下载
资源详情
[{"title":"( 1 个子文件 3KB ) 随机清洁机器人的基于模型的值迭代算法:强化学习和动态规划(随机)的一个例子-matlab开发","children":[{"title":"stochastic_robot_cleaning_v1.zip <span style='color:#111;'> 2.80KB </span>","children":null,"spread":false}],"spread":true}]
评论信息
其他资源
网上招标系统(ASP源代码)
QT编写的简易安防视频监控系统
MCP42010系列程控电位器
集合卡尔曼滤波算法-数据同化的经典算法,Matlab编写
CSR-SIW带通滤波器
DWM1000 测距源码 定位基础
linux下FTP服务器与客户端的C语言实现
学生社团管理系统 c++ MFC 课程设计
viSIO各大图形图标集合
Myeclipse开发JSP新闻发布系统含实验报告
sublime text3最新版豆沙绿护眼主题
opencv-face.zip
ADI数字正交上变频器AD9957初始化Verilog代码
怎么老师已经存在呢 ,上传个文件卡真费劲.zip
Release_x64 6.4.rar
功能组件-源码
putty使用教程.zip
GEC210 Linux驱动源码
银行储蓄系统数据库设计
Wigner Ville
FFT进行FMCW雷达频谱分析的改进算法
计算机基本操作
Windows防火墙与网络封包截获技术光盘(源代码)
芯片验证漫游指南附赠源代码.zip
数值分析课件
免责申明
【只为小站】的资源来自网友分享,仅供学习研究,请务必在下载后24小时内给予删除,不得用于其他任何用途,否则后果自负。基于互联网的特殊性,【只为小站】 无法对用户传输的作品、信息、内容的权属或合法性、合规性、真实性、科学性、完整权、有效性等进行实质审查;无论 【只为小站】 经营者是否已进行审查,用户均应自行承担因其传输的作品、信息、内容而可能或已经产生的侵权或权属纠纷等法律责任。
本站所有资源不代表本站的观点或立场,基于网友分享,根据中国法律《信息网络传播权保护条例》第二十二条之规定,若资源存在侵权或相关问题请联系本站客服人员,zhiweidada#qq.com,请把#换成@,本站将给予最大的支持与配合,做到及时反馈和处理。关于更多版权及免责申明参见 版权及免责申明
个人信息
点我去登录
购买积分
下载历史
恢复订单
相关资源标签
Actionscript
C
C#
C++
Delphi
Java
Javascript
Perl
PHP
Python
VB
Web开发
硬件开发
其它
热门下载
ios无人直播 虚拟视频实用版 可以导入视频
ChinaMeteorologicalDataHandler.R
通过svm cnn knn对高光谱数据集PaviaU进行分类(matlab)
C4.5决策树算法的Python代码和数据样本
EEMD算法应用于信号去噪.rar
故障诊断数据集及实现代码
简易示波器-精英板.zip
韦来生《数理统计》课后习题与答案
simulink仿真实现光伏发电MPPT+能量管理
芯片验证漫游指南以及源代码.zip
画程(版本6.0.0.127)setup个人版
BP_PID控制仿真.rar
基于MQ2烟雾传感器的STM32F103程序
Vivado license 永久
Autojs 例子 源码 1600多个教程源码
最新下载
论文研究-正交空时分组码在瑞利衰落信道下的性能分析.pdf
奇迹客户端模型查看软件 MUModelView0.02
GM工具MuEdit8.71B
win11-圣天诺加密狗驱动(Sentinel_LDK_Run-time_setup)是专为使用hsap加密狗的用户打造专用驱动
60秒排ET超排-免狗稳定版(亲测可用)
IAR-C-FOR-SAM8-V221A带破解
JSM567 JSM578 主控 硬盘盒固件更新以及量产工具 修改硬盘休眠时间
ABCAutoCAD_RasterManager
MuEditor 1.9.9.7z
notepad++ tagview插件