只为小站
首页
域名查询
文件下载
登录
首页
确定性清洁机器人的 Q-learning(无模型值迭代)算法:使用 Q-learning 和 epsilon-greedy 探索的强化学习示例-matlab开发
确定性清洁机器人的 Q-learning(无模型值迭代)算法:使用 Q-learning 和 epsilon-greedy 探索的强化学习示例-matlab开发
上传者:
38723516
|
上传时间: 2022-07-29 00:17:17
|
文件大小: 3KB
|
文件类型: ZIP
matlab
Q-learning with epsilon-greedy explore Algorithm for Deterministic Cleaning Robot V1 确定性清洁机器人 MDP 清洁机器人必须收集用过的罐子也必须为其充电电池。 状态描述了机器人的位置和动作描述运动的方向。 机器人可以向左移动或向左移动正确的。 第一个 (1) 和最后 (6) 个状态是终端状态。 目标是找到最大化回报的最优策略从任何初始状态。 这里是 Q-learning epsilon-greedy 探索使用算法(在强化学习中)。 算法 2-3,来自: @book{busoniu2010reinforcement, title={使用函数逼近器的强化学习和动态规划}, 作者={Busoniu,Lucian 和 Babuska,Robert 和 De Schutter,Bart 和 Ernst,Damien
文件下载
立即下载
资源详情
[{"title":"( 1 个子文件 3KB ) 确定性清洁机器人的 Q-learning(无模型值迭代)算法:使用 Q-learning 和 epsilon-greedy 探索的强化学习示例-matlab开发","children":[{"title":"qlearning.zip <span style='color:#111;'> 2.62KB </span>","children":null,"spread":false}],"spread":true}]
评论信息
其他资源
mac的颜色配置文件
DXF转G代码源程序
( 实用最优化方法(第3版.大连理工大学.高清版.zip )
JDY-40手册.pdf
学校勤工助学管理系统
arcgis api for js轨迹移动
进化聚类算法matlab源程序
数字钟的设计电路 包含整点报时 校时电路 闹钟
STM32F103RCT6最小系统原理图
改进的模糊BP神经网络及在犯罪预测中的应用
jasperReports根据Jaspersoft Studio导出报表通用工具类
Visio2010.rar
武午铁艺协会章程.docx
NOIP宝藏hack数据3.zip
mfc多线程文件下载器
论文研究-基于ARM的嵌入式网络视频监控系统的设计与实现 .pdf
PWM整流器及其控制PDF-PWM整流器及其控制.part2.rar
Apachehttpd-2.2.21-win32-x86-no_ssl.msi
c#银行取号代码
matlab清华大学电子书
cc攻击源码
免责申明
【只为小站】的资源来自网友分享,仅供学习研究,请务必在下载后24小时内给予删除,不得用于其他任何用途,否则后果自负。基于互联网的特殊性,【只为小站】 无法对用户传输的作品、信息、内容的权属或合法性、合规性、真实性、科学性、完整权、有效性等进行实质审查;无论 【只为小站】 经营者是否已进行审查,用户均应自行承担因其传输的作品、信息、内容而可能或已经产生的侵权或权属纠纷等法律责任。
本站所有资源不代表本站的观点或立场,基于网友分享,根据中国法律《信息网络传播权保护条例》第二十二条之规定,若资源存在侵权或相关问题请联系本站客服人员,zhiweidada#qq.com,请把#换成@,本站将给予最大的支持与配合,做到及时反馈和处理。关于更多版权及免责申明参见 版权及免责申明
个人信息
点我去登录
购买积分
下载历史
恢复订单
相关资源标签
热门下载
android studio课程设计作业PPT+设计文档+可运行源代码+设计思路
拾荒者扫描器.zip
《应用非线性控制》(美)斯洛坦著;程代展译(清晰)
王万良-人工智能导论(第五版)课件
matlab时频分析工具箱+安装方法+函数说明+最新版tftb.
【SystemVerilog】路科验证V2学习笔记(全600页).pdf
PowerBI视觉对象共计271组,更新日期2021.01.20日.zip
画程(版本6.0.0.127)setup个人版
android开发期末大作业.zip
token登录器.rar
DBSCAN算法Matlab实现
java-spring-web-外文文献翻译40篇.zip
Python+OpenCV实现行人检测(含配置说明)
采用K-means聚类,实现多维矩阵的聚类,并进行可视化展示(matlab)
华为结构与材料工程师-知识点总结【by詹姆斯申易登】.pdf
最新下载
英雄王座onlineb.zip
phpMyAdmin批量破解工具.rar
御剑1.5 想念初恋
黑帽常用:劫持百度蜘蛛(关键词劫持)跳转js演示
BBasic2.0虚拟机及编程平台
昌斯特hd-wifi工业内窥镜app
将Dell T30刷成3620
wmsxwd (2).exe
unity音乐节奏休闲游戏源码(类似节奏大师).zip
MatLab强化学习_倒立摆控制.zip