只为小站
首页
域名查询
文件下载
登录
首页
确定性清洁机器人的 Q-learning(无模型值迭代)算法:使用 Q-learning 和 epsilon-greedy 探索的强化学习示例-matlab开发
确定性清洁机器人的 Q-learning(无模型值迭代)算法:使用 Q-learning 和 epsilon-greedy 探索的强化学习示例-matlab开发
上传者:
38723516
|
上传时间: 2022-07-29 00:17:17
|
文件大小: 3KB
|
文件类型: ZIP
matlab
Q-learning with epsilon-greedy explore Algorithm for Deterministic Cleaning Robot V1 确定性清洁机器人 MDP 清洁机器人必须收集用过的罐子也必须为其充电电池。 状态描述了机器人的位置和动作描述运动的方向。 机器人可以向左移动或向左移动正确的。 第一个 (1) 和最后 (6) 个状态是终端状态。 目标是找到最大化回报的最优策略从任何初始状态。 这里是 Q-learning epsilon-greedy 探索使用算法(在强化学习中)。 算法 2-3,来自: @book{busoniu2010reinforcement, title={使用函数逼近器的强化学习和动态规划}, 作者={Busoniu,Lucian 和 Babuska,Robert 和 De Schutter,Bart 和 Ernst,Damien
文件下载
立即下载
资源详情
[{"title":"( 1 个子文件 3KB ) 确定性清洁机器人的 Q-learning(无模型值迭代)算法:使用 Q-learning 和 epsilon-greedy 探索的强化学习示例-matlab开发","children":[{"title":"qlearning.zip <span style='color:#111;'> 2.62KB </span>","children":null,"spread":false}],"spread":true}]
评论信息
其他资源
象过河软件至尊版V6.3.228全功能破解版含注册机
串口助手大全(包含10种各类串口助手)
飞歌LOGO修改工具免费下载
西门子S7-200+PLC应用100例
LabVIEW多通道数据采集系统源程序
数控机床数据采集系统
阿伦方差的matlab实现
VLFeat 官方工具包
精伦IDR210 IDR200 2016年最新4.1通用二次开发包 DEMO
osgb.osg.ive.obj互转工具
Java模拟操作系统实验之四种进程调度算法实现(FCFS,SJF,RR,HRN)
Q系列串行口通信模块用户参考手册QJ71C24N(基础篇).pdf
可乐-源码
软件架构文档(样例).doc
酒店网站源码 v1.0
福大fzu OJ题目
chromesetup
基于 Ki nec t 的实时手势识别
JPEG压缩源代码
mysql函数大全(PDF版).pdf
Mastering TypeScript - Second Edition
华为光猫ONT维修使能工具(国内版)
contour等值线源程序
FPGA之道是一本初学者可以看的
GSM模块测试软件,GPRS测试\GSM模块收发短信测试
免责申明
【只为小站】的资源来自网友分享,仅供学习研究,请务必在下载后24小时内给予删除,不得用于其他任何用途,否则后果自负。基于互联网的特殊性,【只为小站】 无法对用户传输的作品、信息、内容的权属或合法性、合规性、真实性、科学性、完整权、有效性等进行实质审查;无论 【只为小站】 经营者是否已进行审查,用户均应自行承担因其传输的作品、信息、内容而可能或已经产生的侵权或权属纠纷等法律责任。
本站所有资源不代表本站的观点或立场,基于网友分享,根据中国法律《信息网络传播权保护条例》第二十二条之规定,若资源存在侵权或相关问题请联系本站客服人员,zhiweidada#qq.com,请把#换成@,本站将给予最大的支持与配合,做到及时反馈和处理。关于更多版权及免责申明参见 版权及免责申明
个人信息
点我去登录
购买积分
下载历史
恢复订单
相关资源标签
热门下载
python实现的学生信息管理系统—GUI界面版
麻雀搜索算法(SSA)优化bp网络
SSM外文文献和翻译(毕设论文精品).doc
大唐杯资料+题库(移动通信)
quartus II13.0器件库.zip
Academic+Phrasebank+2021+Edition+_中英文对照.pdf
scratch版 我的世界.sb2
C4.5决策树算法的Python代码和数据样本
非线性本构关系在ABAQUS中的实现.pdf
刚萨雷斯《数字图像处理》第四版答案.pdf
模型预测控制MPC(模型预测电流控制,MPCC)的simulink仿真,2016b版本
长江流域shp.zip
基于hadoop商品推荐系统课程设计
中国地面气候资料日值数据集(V3.0)2014-2019.zip
基于傅里叶算子的手势识别的完整源代码(Python实现,包含样本库)
最新下载
Python-电信用户流失预测
quartz:SpringBoot 集成 Quartz 实现可控的任务
AIR-CT2500-K9-2-0-0-0-FUS.aes
dtmf2num(DTMF识别).rar
Apabi Reader 3.2打印成PDF软件
6531E硬件资料.rar
VN007+ 1.12.8固件版本下载
配电终端证书管理工具V2.rar
MFC串口助手......
CS188 人工智能全部资料.rar