只为小站
首页
域名查询
文件下载
登录
首页
确定性清洁机器人的 Q-learning(无模型值迭代)算法:使用 Q-learning 和 epsilon-greedy 探索的强化学习示例-matlab开发
确定性清洁机器人的 Q-learning(无模型值迭代)算法:使用 Q-learning 和 epsilon-greedy 探索的强化学习示例-matlab开发
上传者:
38723516
|
上传时间: 2022-07-29 00:17:17
|
文件大小: 3KB
|
文件类型: ZIP
matlab
Q-learning with epsilon-greedy explore Algorithm for Deterministic Cleaning Robot V1 确定性清洁机器人 MDP 清洁机器人必须收集用过的罐子也必须为其充电电池。 状态描述了机器人的位置和动作描述运动的方向。 机器人可以向左移动或向左移动正确的。 第一个 (1) 和最后 (6) 个状态是终端状态。 目标是找到最大化回报的最优策略从任何初始状态。 这里是 Q-learning epsilon-greedy 探索使用算法(在强化学习中)。 算法 2-3,来自: @book{busoniu2010reinforcement, title={使用函数逼近器的强化学习和动态规划}, 作者={Busoniu,Lucian 和 Babuska,Robert 和 De Schutter,Bart 和 Ernst,Damien
文件下载
立即下载
资源详情
[{"title":"( 1 个子文件 3KB ) 确定性清洁机器人的 Q-learning(无模型值迭代)算法:使用 Q-learning 和 epsilon-greedy 探索的强化学习示例-matlab开发","children":[{"title":"qlearning.zip <span style='color:#111;'> 2.62KB </span>","children":null,"spread":false}],"spread":true}]
评论信息
其他资源
昇润CC2541蓝牙透传模块使用说明
基于STM32F1的霍尔传感器测速程序
信息检索导论课后习题答案
数字图像处理与分析 [杨帆 编著] 2015年版.pdf
sp37系统全套开发工具,包括编译软件,例程,这个可是官网都找不到的哦
基于labview声音采集与分析设计
STK基础教程
基于Linux的员工信息管理系统
Zero远控_10
TEQC + QCVIEW32 + dos4gw + DOSBox-0.74
四种方式实现数值积分运算
ipmitool-1.8.18-windows
Audiotrack
yaolog v1.5(很有特色的C++跨平台日志库)
小程序医疗保健课程(完整带node后台).zip
AN_SY8089.pdf
UniBeast-10.0.0黑苹果启动优盘制作工具
SerialDebug V3.0
跨平台的C++日志库
plasma physics via computer simulation
STM32-串口1收发+串口2
免责申明
【只为小站】的资源来自网友分享,仅供学习研究,请务必在下载后24小时内给予删除,不得用于其他任何用途,否则后果自负。基于互联网的特殊性,【只为小站】 无法对用户传输的作品、信息、内容的权属或合法性、合规性、真实性、科学性、完整权、有效性等进行实质审查;无论 【只为小站】 经营者是否已进行审查,用户均应自行承担因其传输的作品、信息、内容而可能或已经产生的侵权或权属纠纷等法律责任。
本站所有资源不代表本站的观点或立场,基于网友分享,根据中国法律《信息网络传播权保护条例》第二十二条之规定,若资源存在侵权或相关问题请联系本站客服人员,zhiweidada#qq.com,请把#换成@,本站将给予最大的支持与配合,做到及时反馈和处理。关于更多版权及免责申明参见 版权及免责申明
个人信息
点我去登录
购买积分
下载历史
恢复订单
相关资源标签
热门下载
基于蒙特卡洛生成电动汽车充电负荷曲线程序
基于STM32的FFT频谱分析+波形识别
华为OD机试真题.pdf
采用K-means聚类,实现多维矩阵的聚类,并进行可视化展示(matlab)
中国地面气候资料日值数据集(V3.0)-201001201912.rar
基于javaweb的网上购物系统(毕业论文+答辩PPT+开题报告+源代码)
模型预测控制MPC(模型预测电流控制,MPCC)的simulink仿真,2016b版本
得到品控手册7.0.pdf
拾荒者.exe同时ID扫描器IP扫描器
csma/ca和csma/cd的matlab仿真源代码带有详细的注释
scratch版 我的世界.sb2
基于FPGA的DDS信号发生器设计(频率、幅度、波形可调)
新型冠状病毒疫情_2020年东三省数学建模A题_论文展示
Android小项目——新闻APP(源码)
基于STM32的电子时钟设计
最新下载
Microsoft Visual Studio 2013 Language Pack - ENU 英文离线语言包.rar
stm32和安卓通信例程
基于IPv6校园网络升级方案
surfer15破解版(英文界面)
通过FPGA驱动ad9226采集信号实现FFT变换
南大傲拓NA200 PLC基本操作视频教程.rar
维盟FBM-220G救砖TFTP刷机教程带固件
Vivado FFT核仿真实现(含Vivado207.4版本工程和MATLAB验证源代码)
freebase-FB2M数据
障碍地图.zip