只为小站
首页
域名查询
文件下载
登录
首页
确定性清洁机器人的 Q-learning(无模型值迭代)算法:使用 Q-learning 和 epsilon-greedy 探索的强化学习示例-matlab开发
确定性清洁机器人的 Q-learning(无模型值迭代)算法:使用 Q-learning 和 epsilon-greedy 探索的强化学习示例-matlab开发
上传者:
38723516
|
上传时间: 2022-07-29 00:17:17
|
文件大小: 3KB
|
文件类型: ZIP
matlab
Q-learning with epsilon-greedy explore Algorithm for Deterministic Cleaning Robot V1 确定性清洁机器人 MDP 清洁机器人必须收集用过的罐子也必须为其充电电池。 状态描述了机器人的位置和动作描述运动的方向。 机器人可以向左移动或向左移动正确的。 第一个 (1) 和最后 (6) 个状态是终端状态。 目标是找到最大化回报的最优策略从任何初始状态。 这里是 Q-learning epsilon-greedy 探索使用算法(在强化学习中)。 算法 2-3,来自: @book{busoniu2010reinforcement, title={使用函数逼近器的强化学习和动态规划}, 作者={Busoniu,Lucian 和 Babuska,Robert 和 De Schutter,Bart 和 Ernst,Damien
文件下载
立即下载
资源详情
[{"title":"( 1 个子文件 3KB ) 确定性清洁机器人的 Q-learning(无模型值迭代)算法:使用 Q-learning 和 epsilon-greedy 探索的强化学习示例-matlab开发","children":[{"title":"qlearning.zip <span style='color:#111;'> 2.62KB </span>","children":null,"spread":false}],"spread":true}]
评论信息
其他资源
西门子802D TOOLBOX
rtl8188eu驱动源码.zip
Android蓝牙遥控器(字符串形式)应用例程——bluetoothdemo/BluetoothUnv
protues最新元件库.zip
C#网络调试助手
湖北省行政区划(区县)
非常完整的ffmpeg+mfc播放器
基于winpcap的网络嗅探器C语言源代码
组态王彻底卸载软件
echarts地图全国各地城市坐标经纬度
VC++6.0安装包绿色版.zip
字模3.91增强版含注册机
stm32+测速+调速2019.5.30.rar
050421-S6D0123 Recommended Initial Sequence ver0_0.pdf
TreeNMS数据库管理系统说明.pdf
stm32移植freemodbus_mdk例程_已测试通过
SQL触发器应用实例(Delphi+数据库)..rar
jsp+ssm+mysql实现在线考试系统.zip
tcs230颜色识别传感器
铣刀头cad图纸
基于yacclex描述的Delphi公式解析器..rar
模糊车牌识别
免责申明
【只为小站】的资源来自网友分享,仅供学习研究,请务必在下载后24小时内给予删除,不得用于其他任何用途,否则后果自负。基于互联网的特殊性,【只为小站】 无法对用户传输的作品、信息、内容的权属或合法性、合规性、真实性、科学性、完整权、有效性等进行实质审查;无论 【只为小站】 经营者是否已进行审查,用户均应自行承担因其传输的作品、信息、内容而可能或已经产生的侵权或权属纠纷等法律责任。
本站所有资源不代表本站的观点或立场,基于网友分享,根据中国法律《信息网络传播权保护条例》第二十二条之规定,若资源存在侵权或相关问题请联系本站客服人员,zhiweidada#qq.com,请把#换成@,本站将给予最大的支持与配合,做到及时反馈和处理。关于更多版权及免责申明参见 版权及免责申明
个人信息
点我去登录
购买积分
下载历史
恢复订单
相关资源标签
热门下载
PLECS中文手册.pdf
数字图像处理[冈萨雷斯]
avantage 软件 xps 处理软件30天后不能使用问题
基于hadoop商品推荐系统课程设计
多智能体的编队控制matlab程序(自己编写的,可以运行)
2020年数学建模B题(国二)论文.pdf
Vivado永久激活license(亲测可用)包(搜集的全部可用LICENSE)
基于matlab的车牌识别系统设计
多目标优化算法(四)NSGA3的代码(python3.6)
PowerBI视觉对象共计271组,更新日期2021.01.20日.zip
《MIMO-OFDM无线通信技术及MATLAB实现》高清PDF及源代码
多目标优化算法(四)NSGA3的代码(MATLAB)
IEEE 39节点系统的Simulink模型
通过svm cnn knn对高光谱数据集PaviaU进行分类(matlab)
商用密码应用与安全性评估——霍炜.pdf
最新下载
VisionPro中文教程
C#调用VisionPro源码示例
鼎捷ERP、易飞、易助ERP最新数据字典
ISAR 仿真到成像流程1
[MATLAB从入门到精通].胡晓冬.董辰辉.扫描版
一体式PN532新版CH340【驱动】.zip
N2N服务器版(windows)V2.1,带设置系统启动软件
微信小程序(通过蓝牙发送接收数据与下位机通信)
STAP_matlab仿真_STAP代码_STAP_空时自适应处理_
合肥工业大学数字逻辑电路 往年期末试卷 真题