Q-learning with epsilon-greedy explore Algorithm for Deterministic Cleaning Robot V1 确定性清洁机器人 MDP 清洁机器人必须收集用过的罐子也必须为其充电电池。 状态描述了机器人的位置和动作描述运动的方向。 机器人可以向左移动或向左移动正确的。 第一个 (1) 和最后 (6) 个状态是终端状态。 目标是找到最大化回报的最优策略从任何初始状态。 这里是 Q-learning epsilon-greedy 探索使用算法(在强化学习中)。 算法 2-3,来自: @book{busoniu2010reinforcement, title={使用函数逼近器的强化学习和动态规划}, 作者={Busoniu,Lucian 和 Babuska,Robert 和 De Schutter,Bart 和 Ernst,Damien
2022-07-29 00:17:17 3KB matlab
1
matlab插值代码解释FSRCNN 由Pytorch和Matlab复制《加速超分辨率卷积神经网络》(CVPR 2016)论文。 依存关系 Matlab 2016 火炬1.0.0 解释 论文作者url:提供的一些Matlab代码。 使用两种语言进行项目的主要原因是因为双三次插值的实现方式不同,这导致使用PSNR标准时结果的差异更大。 概述 网络概述和与SRCNN的比较: 用法 使用./data_pro/data_aug.m进行扩充。 使用./data_pro/generate_train.m生成train.h5。 使用./data_pro/generate_test.m生成test.h5。 乘坐train.py火车: python train.py 将Pytorch模型.pkl转换为Matlab矩阵.mat。 (weights.pkl-> weights.mat) python convert.py 使用./test/demo_FSRCNN.m获得结果。 结果 使用./model/weights.mat可以得到结果: Set5平均:重建PSNR = 32.52dB VS双三次PSNR
2022-07-28 20:39:21 7.89MB 系统开源
1
对输入的视频进行二值化处理,选用二值化算法是自适应阀值的OTSU法
2022-07-27 23:08:29 1.53MB OPNECV自适应阀值 大津法 otsu
1
本文主要讲了电感器的串联和并联电阻值计算方法,希望对您的学习有所帮助。
2022-07-27 11:10:41 37KB 电感器 串联 并联 文章
1
读取PC-DMIS评价到Excel,能兼容新型评价方式和传统评价方式;支持PC-DMIS2020及之前版本,读取速度快。
2022-07-27 09:05:10 2.29MB PC-DMIS Excel
1
台球模拟 台球物理模拟。 使用 Visual python (vPython) 和 tKinter,用户能够使用自定义输入值测试模拟。 需要 Python 和 vPython 才能运行模拟。 #设置#Windows 为 Windows 安装 Python 为 Python 安装 vPython 为 Python 安装 tKinter 运行 gui.py #Linux 安装 vPython - 打开终端并输入“sudo apt-get install python-visual” 安装 Tkinter - 打开终端并输入“sudo apt-get install python-tk” 在项目目录中输入“python gui.py” #Realistic 输入值要正确运行逼真的模拟,请在运行模拟之前对输入变量使用以下值。 质量 = 0.107 公斤 线性力 = 108 N
2022-07-26 18:27:50 416KB Python
1
六、缺失值的处理 SPSS中缺失值默认为圆点“.” DATA中设置了3种设置缺失值的方式 TRANSFORM下设置了5中不同的替代缺失值的方法。 缺失值的处理方法
2022-07-26 17:52:26 2.5MB spss
1
【009期】SPSS 缺失值处理.docx
2022-07-26 17:35:40 579KB SPSS
1
修改文件的md5值,选择文件点击一下即可修改
2022-07-26 09:00:06 176KB 免杀 md5
1
此函数执行插值的速度比 MATLAB 的“interp1”函数快。 在小型库和搜索数组的限制下,它快了约 5 倍。 在大型库数组的限制下,qinterp1 具有平坦的缩放比例,而 interp1 具有线性增加的缩放比例(请参阅此文件的图像)。 qinterp1 需要一个均匀间隔、单调递增的 x 数组。 与 interp1 一样,qinterp1 为越界的 xi 值返回 NaN。 根据 John D'Errico 的建议,最近下邻方法已更改为现在使用真正的最近邻插值(以轻微的速度成本)。 关于错误检查的说明:因为对库数组的任何错误检查都会破坏平面缩放定律,因此该函数不对库(x 和 y)数组执行错误检查。 如果 y 和 xi 数组不是列向量或行向量,则此函数将返回错误。 输入“help qinterp1”以获取使用说明。 这对于很多版本应该是向后兼容的。 它是独立于平台的。 附图显
2022-07-25 22:55:55 2KB matlab
1