只为小站
首页
域名查询
文件下载
登录
首页
确定性清洁机器人的 Q-learning(无模型值迭代)算法:使用 Q-learning 和 epsilon-greedy 探索的强化学习示例-matlab开发
确定性清洁机器人的 Q-learning(无模型值迭代)算法:使用 Q-learning 和 epsilon-greedy 探索的强化学习示例-matlab开发
上传者:
38723516
|
上传时间: 2022-07-29 00:17:17
|
文件大小: 3KB
|
文件类型: ZIP
matlab
Q-learning with epsilon-greedy explore Algorithm for Deterministic Cleaning Robot V1 确定性清洁机器人 MDP 清洁机器人必须收集用过的罐子也必须为其充电电池。 状态描述了机器人的位置和动作描述运动的方向。 机器人可以向左移动或向左移动正确的。 第一个 (1) 和最后 (6) 个状态是终端状态。 目标是找到最大化回报的最优策略从任何初始状态。 这里是 Q-learning epsilon-greedy 探索使用算法(在强化学习中)。 算法 2-3,来自: @book{busoniu2010reinforcement, title={使用函数逼近器的强化学习和动态规划}, 作者={Busoniu,Lucian 和 Babuska,Robert 和 De Schutter,Bart 和 Ernst,Damien
文件下载
立即下载
资源详情
[{"title":"( 1 个子文件 3KB ) 确定性清洁机器人的 Q-learning(无模型值迭代)算法:使用 Q-learning 和 epsilon-greedy 探索的强化学习示例-matlab开发","children":[{"title":"qlearning.zip <span style='color:#111;'> 2.62KB </span>","children":null,"spread":false}],"spread":true}]
评论信息
其他资源
ABB变频一拖二恒压供水EPLAN宏
Cortex-M3权威指南(中文).pdf
JAVA实现多元一次方程组的算法
snmp网络管理系统
基于TPS5430的DC-DC电源设计(原理图、PCB)
计算机组成原理课件ppt(比看白中英的书效果好多了)
vc++6.0中文版(支持win7 )
COMSOL(5.4版本)破解文件
机票预订信息系统
QI标准V1.2.4.rar
双向可逆DC/DC MATLAB模型
Microsoft Visual Studio 6.0 Enterprise Edition 9CD光盘镜像:VSE600ENU3.iso
c语言编写的PQ分解法潮流程序(有详细注释哦)
经典平差程序
小费-源码
GSM 与 8051 微控制器的对接GSM28051-Interfacing.zip
活动行前端源码huodongxing.rar
初识Papervision3D
[答案] computer networks(5th edition write by ANDREW S.TANENBAUM)
opc应用程序入门,学习OPC的必备
Final IK 1.8 最新版
基于密度的聚类
DspSocketTest
AD1674原程序和Proteus仿真
学生信息管理系统(c#+sql)
隐私集合交集计算技术报告
免责申明
【只为小站】的资源来自网友分享,仅供学习研究,请务必在下载后24小时内给予删除,不得用于其他任何用途,否则后果自负。基于互联网的特殊性,【只为小站】 无法对用户传输的作品、信息、内容的权属或合法性、合规性、真实性、科学性、完整权、有效性等进行实质审查;无论 【只为小站】 经营者是否已进行审查,用户均应自行承担因其传输的作品、信息、内容而可能或已经产生的侵权或权属纠纷等法律责任。
本站所有资源不代表本站的观点或立场,基于网友分享,根据中国法律《信息网络传播权保护条例》第二十二条之规定,若资源存在侵权或相关问题请联系本站客服人员,zhiweidada#qq.com,请把#换成@,本站将给予最大的支持与配合,做到及时反馈和处理。关于更多版权及免责申明参见 版权及免责申明
个人信息
点我去登录
购买积分
下载历史
恢复订单
相关资源标签
热门下载
数字图像处理[冈萨雷斯]
风电场风速及功率数据.zip
机械臂碰撞检测 八组逆解碰撞检测 机械臂避障路径规划
得到品控手册7.0.pdf
超大规模集成电路先进光刻理论与应用.pdf
云视通扫描工具.zip
韦来生《数理统计》课后习题与答案
通过svm cnn knn对高光谱数据集PaviaU进行分类(matlab)
2022学术英语写作(东南大学) 章节测试+期末test答案
基于MATLAB的水果图像识别
avantage 软件 xps 处理软件30天后不能使用问题
DBSCAN算法Matlab实现
ChinaMeteorologicalDataHandler.R
PLECS中文手册.pdf
STM32F4时钟触发ADC双通道采样DMA传输进行FFT+测频率+采样频率可变+显示波形
最新下载
礼券提货系统源码.rar
GPU与MATLAB混合编程之书本实现代码
自助提卡自助提卡自助提卡自助提卡
微信小程序代码 通过访问Onenet平台API获取设备属性,在线状态,以及发送指令
我的世界机器熊工具我的世界高级压测工具.zip
mc压测源码
我的世界压测工具,威力很大,有些防御力强的服务器可能失效
雪崩:Minecraft服务器压力测试工具-源码
刷bios神器v4.2-1/2/3/4/5/6/7/8/9/10/11/12代主板刷bios跳过校验工具
DOSBOX安装包(含Debug,MASM,Edit.exe)