只为小站
首页
域名查询
文件下载
登录
首页
开发技术
其它
随机清洁机器人的基于模型的值迭代算法:强化学习和动态规划(随机)的一个例子-matlab开发
随机清洁机器人的基于模型的值迭代算法:强化学习和动态规划(随机)的一个例子-matlab开发
上传者:
38627521
|
上传时间: 2021-09-17 17:03:41
|
文件大小: 3KB
|
文件类型: ZIP
matlab
随机清洁机器人的基于模型的值迭代算法。 这段代码是值迭代算法的一个非常简单的实现,对于强化学习和动态规划领域的初学者来说,它是一个有用的起点。 随机清洁机器人 MDP:清洁机器人必须收集用过的罐子,还必须为电池充电。 状态描述了机器人的位置,动作描述了运动的方向。 机器人可以向左或向右移动。 第一个 (0) 和最后 (5) 个状态是终止状态。 目标是找到一个最优策略,使任何初始状态的回报最大化。 这里是 Q-iteration(基于模型的值迭代 DP)。 参考:算法 2-2,来自: @book{busoniu2010reinforcement, title={使用函数逼近器的强化学习和动态规划}, 作者={Busoniu,Lucian 和 Babuska,Robert 和 De Schutter,Bart 和 Ernst,Damien}, 年={2010}, 出版商={CRC Press}
文件下载
立即下载
资源详情
[{"title":"( 1 个子文件 3KB ) 随机清洁机器人的基于模型的值迭代算法:强化学习和动态规划(随机)的一个例子-matlab开发","children":[{"title":"stochastic_robot_cleaning_v1.zip <span style='color:#111;'> 2.80KB </span>","children":null,"spread":false}],"spread":true}]
评论信息
其他资源
黑苹果系统AR9565无线网卡驱动及方法
delphi 7 idhttp post 的8种使用方法(含源码)
基于STM32 嵌入式实验DHT11温湿度传感器测量湿度
hyperledgerfabric开发实战-快速掌握区块链技术
给黑苹果的人使用,自动生成efi
msftpsrvr.exe
用TCP_IP进行网际互联第三卷_客户——服务器(配套全部源代码)
GPS信号产生
BQ25895的软件配置
图片浏览器(Java实现) 自动播放图片
Visio网络拓扑图模具(Cisco、IBM、H3C)
AndroidStudio实现的录音机可以显示波形和频谱
AD封装库 常用音视频类封装
HMM的matlab程序
nestjs-events-sample-源码
使用Voverage Directed仿真在SLM和TLM之间进行等效检查
Lua 5.1 for delphi 2010-XE4
SciPy_Tokyo_Hands-on TensorFlow 2.0.pdf
铁路曲线正矢整正拨量计算
基于图割的图像分割OpenCV+MFC实现
SSD caffe模型
免责申明
【只为小站】的资源来自网友分享,仅供学习研究,请务必在下载后24小时内给予删除,不得用于其他任何用途,否则后果自负。基于互联网的特殊性,【只为小站】 无法对用户传输的作品、信息、内容的权属或合法性、合规性、真实性、科学性、完整权、有效性等进行实质审查;无论 【只为小站】 经营者是否已进行审查,用户均应自行承担因其传输的作品、信息、内容而可能或已经产生的侵权或权属纠纷等法律责任。
本站所有资源不代表本站的观点或立场,基于网友分享,根据中国法律《信息网络传播权保护条例》第二十二条之规定,若资源存在侵权或相关问题请联系本站客服人员,zhiweidada#qq.com,请把#换成@,本站将给予最大的支持与配合,做到及时反馈和处理。关于更多版权及免责申明参见 版权及免责申明
个人信息
点我去登录
购买积分
下载历史
恢复订单
相关资源标签
Actionscript
C
C#
C++
Delphi
Java
Javascript
Perl
PHP
Python
VB
Web开发
硬件开发
其它
热门下载
韦来生《数理统计》课后习题与答案
科研伦理与学术规范 期末考试2 (40题).pdf
csma/ca和csma/cd的matlab仿真源代码带有详细的注释
stm32f103+OLED12864+FFT音乐频谱(多种显示效果 提供原理图)
2020年数学建模国赛C题论文
RNN-LSTM卷积神经网络Matlab实现
房价预测的BP神经网络实现_python代码
西门子逻辑控制设计开发_3部10层
简易示波器-精英板.zip
夏天IC助手1.8你们懂的
2021华为芯片研发岗位笔试题
知网情感词典(HOWNET)
BP_PID控制仿真.rar
python大作业--爬虫(完美应付大作业).zip
Plexim Plecs Standalone 4.1.2 x64.7z
最新下载
湖南大学电磁波四个实验加实验报告
sgns.zhihu.bigram.bz2
智能吓数2021安装包
YOLOv11多模态融合[源码]
2025 Jetson Nano极速部署yolov8或11:CUDA10.2适配PyTorch1.11+TorchVision预编译whl包
TW7.0.4.2企业使用版安装包,包含license.dat试用文件
goby2021红队专版,1.8.255
苹果CMSV10模板_自适应模板,电脑、平板、手机移动端完美自适应.zip
NACA翼型生成—profili
Xbox ACC For win7.7z Xbox One 无线手柄适配器2代win7驱动