只为小站
首页
域名查询
文件下载
登录
首页
确定性清洁机器人的 Q-learning(无模型值迭代)算法:使用 Q-learning 和 epsilon-greedy 探索的强化学习示例-matlab开发
确定性清洁机器人的 Q-learning(无模型值迭代)算法:使用 Q-learning 和 epsilon-greedy 探索的强化学习示例-matlab开发
上传者:
38723516
|
上传时间: 2022-07-29 00:17:17
|
文件大小: 3KB
|
文件类型: ZIP
matlab
Q-learning with epsilon-greedy explore Algorithm for Deterministic Cleaning Robot V1 确定性清洁机器人 MDP 清洁机器人必须收集用过的罐子也必须为其充电电池。 状态描述了机器人的位置和动作描述运动的方向。 机器人可以向左移动或向左移动正确的。 第一个 (1) 和最后 (6) 个状态是终端状态。 目标是找到最大化回报的最优策略从任何初始状态。 这里是 Q-learning epsilon-greedy 探索使用算法(在强化学习中)。 算法 2-3,来自: @book{busoniu2010reinforcement, title={使用函数逼近器的强化学习和动态规划}, 作者={Busoniu,Lucian 和 Babuska,Robert 和 De Schutter,Bart 和 Ernst,Damien
文件下载
立即下载
资源详情
[{"title":"( 1 个子文件 3KB ) 确定性清洁机器人的 Q-learning(无模型值迭代)算法:使用 Q-learning 和 epsilon-greedy 探索的强化学习示例-matlab开发","children":[{"title":"qlearning.zip <span style='color:#111;'> 2.62KB </span>","children":null,"spread":false}],"spread":true}]
评论信息
其他资源
支持向量机故障诊断及控制技术 matalb
myvgl2018查看软件
清华大学计算机学科推荐期刊会议列表-20190818.pdf
tinymce富文本编辑器集成demo,添加powerpaste插件,支持word、excel带格式粘贴
小区物业管理系统毕设论文全套(所有毕业设计全套文档,答辩ppt,数据库设计文档
C语言文法流程图 --- 编译原理
gat-linux-x86_64-3.1716.3.c.zip
操作系统的课程设计、请求调页存储管理系统的模拟实现、
《JSP程序设计实训与案例教程源代码》
各种情况手机号清洗udf函数(hive impala)
基于.NET的招聘网站
Eclipes+Juno+Service+Release+2汉化包
网络调试工具
orgapachecommons.zip
Nextcloud-3.1.2-setup .exe
矿产资源登记统计信息系统(建库指南).pdf
重构 改善既有代码的设计(高清无水印).mobi
SQlite3库及头文件分享
电场线图形的模拟
实矩阵与复矩阵的LU分解C++源代码
单纯形法程序
JSP MYSQL电影订票系统
免责申明
【只为小站】的资源来自网友分享,仅供学习研究,请务必在下载后24小时内给予删除,不得用于其他任何用途,否则后果自负。基于互联网的特殊性,【只为小站】 无法对用户传输的作品、信息、内容的权属或合法性、合规性、真实性、科学性、完整权、有效性等进行实质审查;无论 【只为小站】 经营者是否已进行审查,用户均应自行承担因其传输的作品、信息、内容而可能或已经产生的侵权或权属纠纷等法律责任。
本站所有资源不代表本站的观点或立场,基于网友分享,根据中国法律《信息网络传播权保护条例》第二十二条之规定,若资源存在侵权或相关问题请联系本站客服人员,zhiweidada#qq.com,请把#换成@,本站将给予最大的支持与配合,做到及时反馈和处理。关于更多版权及免责申明参见 版权及免责申明
个人信息
点我去登录
购买积分
下载历史
恢复订单
相关资源标签
热门下载
科研伦理与学术规范 期末考试2 (40题).pdf
Plex v7.12电视端app
基于Matlab的PI/4 DQPSK的调制解调源代吗
故障诊断数据集及实现代码
python大作业--爬虫(完美应付大作业).zip
Vivado永久激活license(亲测可用)包(搜集的全部可用LICENSE)
DirectX修复工具V4.1增强版
中国地面气象站观测数据2000-2021
voc车辆检测数据集(已处理好,可直接训练)
多智能体的编队控制matlab程序(自己编写的,可以运行)
基于STM32的电子时钟设计
(推荐)小爱触屏音箱LX04_2.34.5-官改-(开发版)SP5
matlab机器人工具箱实现机械臂直线轨迹&圆弧轨迹规划
大唐杯资料+题库(移动通信)
模型预测控制MPC(模型预测电流控制,MPCC)的simulink仿真,2016b版本
最新下载
DirectX修复工具V4.1增强版
delphi7 RedisClient
OPENMV中文参考资料
Synergy 1.6.2 安装包 Windows+Linux.
ZKEYS公有云管理系统(大陆版)6.0.0.zip
1394 OHCI Compliant Host Controller (Legacy)驱动For_WIN7_X64位.zip
CodeMeterRuntime V6.40 版本
Effective C++ 第三版 PDF (高清,带书签,可复制)
aspose.pdf-17.8.jar
oracle-instantclient11.2 rpm包