只为小站
首页
域名查询
文件下载
登录
首页
开发技术
其它
随机清洁机器人的基于模型的值迭代算法:强化学习和动态规划(随机)的一个例子-matlab开发
随机清洁机器人的基于模型的值迭代算法:强化学习和动态规划(随机)的一个例子-matlab开发
上传者:
38627521
|
上传时间: 2021-09-17 17:03:41
|
文件大小: 3KB
|
文件类型: ZIP
matlab
随机清洁机器人的基于模型的值迭代算法。 这段代码是值迭代算法的一个非常简单的实现,对于强化学习和动态规划领域的初学者来说,它是一个有用的起点。 随机清洁机器人 MDP:清洁机器人必须收集用过的罐子,还必须为电池充电。 状态描述了机器人的位置,动作描述了运动的方向。 机器人可以向左或向右移动。 第一个 (0) 和最后 (5) 个状态是终止状态。 目标是找到一个最优策略,使任何初始状态的回报最大化。 这里是 Q-iteration(基于模型的值迭代 DP)。 参考:算法 2-2,来自: @book{busoniu2010reinforcement, title={使用函数逼近器的强化学习和动态规划}, 作者={Busoniu,Lucian 和 Babuska,Robert 和 De Schutter,Bart 和 Ernst,Damien}, 年={2010}, 出版商={CRC Press}
文件下载
立即下载
资源详情
[{"title":"( 1 个子文件 3KB ) 随机清洁机器人的基于模型的值迭代算法:强化学习和动态规划(随机)的一个例子-matlab开发","children":[{"title":"stochastic_robot_cleaning_v1.zip <span style='color:#111;'> 2.80KB </span>","children":null,"spread":false}],"spread":true}]
评论信息
其他资源
《ARM嵌入式Linux系统开发详解 第2版》PDF版本下载.txt
VS2015 编译的 GSL(GNU Scientific Library)
Java项目经验汇总(简历项目素材)
微机原理与接口技术 多功能密码锁
捷联惯导初始对准Kalman滤程序
简易CPU之verilog设计(原创)
pdfjs-1.9.426
红外遥控原理及nec编码详解
自然语言处理:自然语言进动-情感分析-源码
主动调Q掺镱光纤激光器中放大自发辐射影响的研究
managementSystem.zip
cmake-3.16.2-win32-x86.msi
15系列pcb封装库
android动态添加权限工具包,方便快捷,
基于de2-35的开发板,做的VGA显示图像程序
protues最好的教程
地区三级联动选择器
PRINCE2-2009中文版-项目管理文档类资源
离散数学代数系统的演示程序
CMM 解释器(JAVA实现)
免责申明
【只为小站】的资源来自网友分享,仅供学习研究,请务必在下载后24小时内给予删除,不得用于其他任何用途,否则后果自负。基于互联网的特殊性,【只为小站】 无法对用户传输的作品、信息、内容的权属或合法性、合规性、真实性、科学性、完整权、有效性等进行实质审查;无论 【只为小站】 经营者是否已进行审查,用户均应自行承担因其传输的作品、信息、内容而可能或已经产生的侵权或权属纠纷等法律责任。
本站所有资源不代表本站的观点或立场,基于网友分享,根据中国法律《信息网络传播权保护条例》第二十二条之规定,若资源存在侵权或相关问题请联系本站客服人员,zhiweidada#qq.com,请把#换成@,本站将给予最大的支持与配合,做到及时反馈和处理。关于更多版权及免责申明参见 版权及免责申明
个人信息
点我去登录
购买积分
下载历史
恢复订单
相关资源标签
Actionscript
C
C#
C++
Delphi
Java
Javascript
Perl
PHP
Python
VB
Web开发
硬件开发
其它
热门下载
毕业设计:基于Python的网络爬虫及数据处理(智联招聘)
2020年数模国赛A题论文(省一等奖)和代码.rar
画程(版本6.0.0.127)setup个人版
基于LSTM模型的股票预测模型_python
银行笔试 信息科技岗部分真题
PSO-LSSVM的MATLAB代码.rar
数字图像处理[冈萨雷斯]
(推荐)小爱触屏音箱LX04_2.34.5-官改-(开发版)SP5
新型冠状病毒疫情_2020年东三省数学建模A题_论文展示
基于S函数的BP神经网络PID控制器及Simulink仿真和对应代码模型.zip
倒立摆的模糊控制(基于simulink仿真,适合初学者).rar
神经·模糊·预测控制及其MATLAB实现PDF + MATLAB程序
token登录器.rar
模型预测控制MPC(模型预测电流控制,MPCC)的simulink仿真,2016b版本
Spring相关的外文文献和翻译(含出处).zip
最新下载
ITILv4 认证教程 中文版
YOLOv8预训练权重文件集合(YOLOv8n,YOLOv8s,YOLOv8m,YOLOv8l,YOLOv8x)
ADS1118驱动
C++登录界面程序
解决windows11下无法安装.net framework 3.5(包括.net2.0和3.0)
GB-T 22239-2019 信息安全技术网络安全等级保护基本要求.pdf
ADE20K语义分割色彩参考表格
iris数据集可直接matlab用
OFD所需JAR:ofdrw-full.jar 、ofdrw-layout.jar 、ofdrw-sign.jar 等
互联网金融题库.doc