Q-learning with epsilon-greedy explore Algorithm for Deterministic Cleaning Robot V1 确定性清洁机器人 MDP 清洁机器人必须收集用过的罐子也必须为其充电电池。 状态描述了机器人的位置和动作描述运动的方向。 机器人可以向左移动或向左移动正确的。 第一个 (1) 和最后 (6) 个状态是终端状态。 目标是找到最大化回报的最优策略从任何初始状态。 这里是 Q-learning epsilon-greedy 探索使用算法(在强化学习中)。 算法 2-3,来自: @book{busoniu2010reinforcement, title={使用函数逼近器的强化学习和动态规划}, 作者={Busoniu,Lucian 和 Babuska,Robert 和 De Schutter,Bart 和 Ernst,Damien
2022-07-29 00:17:17 3KB matlab
1
matlab插代码解释FSRCNN 由Pytorch和Matlab复制《加速超分辨率卷积神经网络》(CVPR 2016)论文。 依存关系 Matlab 2016 火炬1.0.0 解释 论文作者url:提供的一些Matlab代码。 使用两种语言进行项目的主要原因是因为双三次插的实现方式不同,这导致使用PSNR标准时结果的差异更大。 概述 网络概述和与SRCNN的比较: 用法 使用./data_pro/data_aug.m进行扩充。 使用./data_pro/generate_train.m生成train.h5。 使用./data_pro/generate_test.m生成test.h5。 乘坐train.py火车: python train.py 将Pytorch模型.pkl转换为Matlab矩阵.mat。 (weights.pkl-> weights.mat) python convert.py 使用./test/demo_FSRCNN.m获得结果。 结果 使用./model/weights.mat可以得到结果: Set5平均:重建PSNR = 32.52dB VS双三次PSNR
2022-07-28 20:39:21 7.89MB 系统开源
1
对输入的视频进行二化处理,选用二化算法是自适应阀的OTSU法
2022-07-27 23:08:29 1.53MB OPNECV自适应阀值 大津法 otsu
1
本文主要讲了电感器的串联和并联电阻计算方法,希望对您的学习有所帮助。
2022-07-27 11:10:41 37KB 电感器 串联 并联 文章
1
读取PC-DMIS评价到Excel,能兼容新型评价方式和传统评价方式;支持PC-DMIS2020及之前版本,读取速度快。
2022-07-27 09:05:10 2.29MB PC-DMIS Excel
1
台球模拟 台球物理模拟。 使用 Visual python (vPython) 和 tKinter,用户能够使用自定义输入测试模拟。 需要 Python 和 vPython 才能运行模拟。 #设置#Windows 为 Windows 安装 Python 为 Python 安装 vPython 为 Python 安装 tKinter 运行 gui.py #Linux 安装 vPython - 打开终端并输入“sudo apt-get install python-visual” 安装 Tkinter - 打开终端并输入“sudo apt-get install python-tk” 在项目目录中输入“python gui.py” #Realistic 输入要正确运行逼真的模拟,请在运行模拟之前对输入变量使用以下。 质量 = 0.107 公斤 线性力 = 108 N
2022-07-26 18:27:50 416KB Python
1
六、缺失的处理 SPSS中缺失默认为圆点“.” DATA中设置了3种设置缺失的方式 TRANSFORM下设置了5中不同的替代缺失的方法。 缺失的处理方法
2022-07-26 17:52:26 2.5MB spss
1
【009期】SPSS 缺失处理.docx
2022-07-26 17:35:40 579KB SPSS
1
修改文件的md5,选择文件点击一下即可修改
2022-07-26 09:00:06 176KB 免杀 md5
1
此函数执行插的速度比 MATLAB 的“interp1”函数快。 在小型库和搜索数组的限制下,它快了约 5 倍。 在大型库数组的限制下,qinterp1 具有平坦的缩放比例,而 interp1 具有线性增加的缩放比例(请参阅此文件的图像)。 qinterp1 需要一个均匀间隔、单调递增的 x 数组。 与 interp1 一样,qinterp1 为越界的 xi 返回 NaN。 根据 John D'Errico 的建议,最近下邻方法已更改为现在使用真正的最近邻插(以轻微的速度成本)。 关于错误检查的说明:因为对库数组的任何错误检查都会破坏平面缩放定律,因此该函数不对库(x 和 y)数组执行错误检查。 如果 y 和 xi 数组不是列向量或行向量,则此函数将返回错误。 输入“help qinterp1”以获取使用说明。 这对于很多版本应该是向后兼容的。 它是独立于平台的。 附图显
2022-07-25 22:55:55 2KB matlab
1