只为小站
首页
域名查询
文件下载
登录
首页
开发技术
其它
随机清洁机器人的基于模型的值迭代算法:强化学习和动态规划(随机)的一个例子-matlab开发
随机清洁机器人的基于模型的值迭代算法:强化学习和动态规划(随机)的一个例子-matlab开发
上传者:
38627521
|
上传时间: 2021-09-17 17:03:41
|
文件大小: 3KB
|
文件类型: ZIP
matlab
随机清洁机器人的基于模型的值迭代算法。 这段代码是值迭代算法的一个非常简单的实现,对于强化学习和动态规划领域的初学者来说,它是一个有用的起点。 随机清洁机器人 MDP:清洁机器人必须收集用过的罐子,还必须为电池充电。 状态描述了机器人的位置,动作描述了运动的方向。 机器人可以向左或向右移动。 第一个 (0) 和最后 (5) 个状态是终止状态。 目标是找到一个最优策略,使任何初始状态的回报最大化。 这里是 Q-iteration(基于模型的值迭代 DP)。 参考:算法 2-2,来自: @book{busoniu2010reinforcement, title={使用函数逼近器的强化学习和动态规划}, 作者={Busoniu,Lucian 和 Babuska,Robert 和 De Schutter,Bart 和 Ernst,Damien}, 年={2010}, 出版商={CRC Press}
文件下载
立即下载
资源详情
[{"title":"( 1 个子文件 3KB ) 随机清洁机器人的基于模型的值迭代算法:强化学习和动态规划(随机)的一个例子-matlab开发","children":[{"title":"stochastic_robot_cleaning_v1.zip <span style='color:#111;'> 2.80KB </span>","children":null,"spread":false}],"spread":true}]
评论信息
其他资源
华清远见-嵌入式Linux应用程序开发详解-清晰PDF
解整数规划的0-1遗传算法
学生成绩管理系统+javaweb毕业设计
C4.5决策树代码
百度账号COOKIE登录浏览器
ADS1256资料大集合
HX108收音机报告.rar
华为认证HCIE-RS3.0-LAB1-OptioneC1 题目
dbeaver3.7.5最新版32位
matlab惩罚函数
plex-download-api:编写用于从Web上为Plex服务器下载媒体的API-源码
点文件-源码
软件工程期末考试试题集
win7 32位和64位的mdmcpq.inf和usbser.sys 文件
武汉理工通信原理期末试题
通过webservices获取当前天气预报
opengl编程指南第7版源代码
springcloud+skywalkingdemo.zip
gtk写的贪吃蛇游戏
单目视觉测距
Fsociety_Keyboard开源无线机械键盘设计文件:原理图,PCB,机械文件
Hadoop- The Definitive Guide, 4th Edition
免责申明
【只为小站】的资源来自网友分享,仅供学习研究,请务必在下载后24小时内给予删除,不得用于其他任何用途,否则后果自负。基于互联网的特殊性,【只为小站】 无法对用户传输的作品、信息、内容的权属或合法性、合规性、真实性、科学性、完整权、有效性等进行实质审查;无论 【只为小站】 经营者是否已进行审查,用户均应自行承担因其传输的作品、信息、内容而可能或已经产生的侵权或权属纠纷等法律责任。
本站所有资源不代表本站的观点或立场,基于网友分享,根据中国法律《信息网络传播权保护条例》第二十二条之规定,若资源存在侵权或相关问题请联系本站客服人员,zhiweidada#qq.com,请把#换成@,本站将给予最大的支持与配合,做到及时反馈和处理。关于更多版权及免责申明参见 版权及免责申明
个人信息
点我去登录
购买积分
下载历史
恢复订单
相关资源标签
Actionscript
C
C#
C++
Delphi
Java
Javascript
Perl
PHP
Python
VB
Web开发
硬件开发
其它
热门下载
token登录器.rar
YOLOv5 人脸口罩图片数据集
校园网规划与设计和pkt文件
适用于eNSP 1.3.00 可加载的USG6000V防火墙设备包
DS证据理论的MATLAB案例程序源代码
超大规模集成电路先进光刻理论与应用.pdf
《MIMO-OFDM无线通信技术及MATLAB实现》高清PDF及源代码
Steam离线安装版
代码随想录知识星球精华-大厂面试八股文第二版v1.2.pdf
java-spring-web-外文文献翻译40篇.zip
王万良-人工智能导论(第五版)课件
基于MQ2烟雾传感器的STM32F103程序
数字图像处理[冈萨雷斯]
全国道路网SHP数据.zip
MPC 模型预测控制matlab仿真程序
最新下载
Q版缓冲区溢出教程(内涵源代码)
西门子MC55资料包
python数学建模算法与应用(课件与习题解答).zip
mysql-connector-net-6.9.12
SOEM v1.4.0 - Simple Open Source EtherCAT Master
tiptop gp技术手册
GrblController361_中文版.rar
考研核心词汇(刘晓艳).pdf
Abaqus UMAT codes: phase-field-fracture in elasto-plastic solids
DW1000中英文开发资料汇总pdf