第六章 朴素贝叶斯分类 6.1 朴素贝叶斯分类数学基础 1.贝叶斯定理 假设对于某个数据集,随机变量 C 表示样本为 C 类的概率,F1 表示测试样本某特征出现的概率,套 用基本贝叶斯公式,则如下所示: 上式表示对于某个样本,特征 F1 出现时,该样本被分为 C 类的条件概率。 对于该公式,需要熟知的概念: 先验概率(Prior):P(C)是 C 的先验概率,可以从已有的训练集中计算分为 C 类的样本占所有样本的 比重得出。 证据(Evidence):即上式 P(F1),表示对于某测试样本,特征 F1 出现的概率。同样可以从训练集中 F1 特征对应样本所占总样本的比例得出。 似然(likelihood):即上式 P(F1|C),表示如果知道一个样本分为 C 类,那么他的特征为 F1 的概率是 多少 对于多特征而言: 贝叶斯定理是基于假设的先验概率给定假设下观察到不同数据的概率,提供了一种计算后验概率的方 法 6.2 朴素贝叶斯分类 1.思想基础 对于给出的待分类项,求解在此项出现的条件下各个类别出现的概率,哪个最大,就认为此待分类项 属于哪个类别。 2.假设条件 1)特征之间相互独立 2)每个特征同等重要 3.朴素的概念
2021-12-04 13:24:12 4.91MB 数据挖掘算法 Python
1
可以处理带有光照的图像,提高图像的识别率 可以处理带有光照的图像,提高图像的识别率
2021-12-03 22:27:25 10KB 光照处理
1
用于文本预处理的Python包 此Python软件包仅用于教育目的。 安装: pip install git+ssh://git@github.com:SejalPatel-2912/text_preprocessing.git 卸载: pip uninstall text_preprocessing
2021-11-30 22:14:39 4KB Python
1
精灵助手标注生成的xml经过此代码转换可支持dlib使用xml
2021-11-30 20:24:23 433KB 图片预处理 标注文件xml dlib训练xml
1
这是对 Zhang-Suen 细化算法以及相关预处理和后处理步骤的改编,如 JR Parker 在。 先决条件 仅适用于 C++ 对于 Python 支持 ,使用 Python 绑定构建。 $ git clone $ cd zhang-suen-thinning 建造 可以通过两种方式构建公开执行 Zhang-Suen 细化函数的库。 为了在 C++ 程序中使用,可以通过进入项目的顶级目录并键入来生成静态库libzhangsuen.a $ make 这将在当前目录中生成libzhangsuen.a ,然后可将其用于链接使用该库的 C++ 程序。 要与 Python 一起使用,必须安装 OpenCV,并使用 Python 支持构建。 然后,可以通过执行构建 Python 扩展 $ make python 这将在python/生成zhangsuen.so ,这是一个可直接从
2021-11-29 21:21:05 29KB C++
1
针对原油总氢物性回归预测中核磁共振光谱数据不足的问题,结合深度学习相关理论,提出一种光谱数据扩增预处理方法.根据样本输入和标签的相关系数,在原始样本中加入随机噪声以生成虚拟样本;处理样本数据结构以利于卷积神经网络特征提取,并加入数据冗余改进该结构以进一步提高数据特征提取的完整性;搭建实现原油总氢物性回归预测的卷积神经网络(Regression forecasting convolutional neural network,RF-CNN).实验结果表明,对于总氢物性的回归预测,该数据扩增预处理方法不但可以解决原始数据训练中的过拟合现象,而且相比于传统的偏最小二乘(PLS)回归方法,更具稳定性和精确性.
1
图像预处理 图像配准 图像融合 图像拼接是计算机视觉的基础
2021-11-28 20:46:59 1.35MB 图像拼接
1
MedicalTorch是pytorch的开源框架,为医学成像实现了大量的加载器,预处理器和数据集。
2021-11-27 14:20:43 774KB Python开发-机器学习
1
NetCDF2LittleR 描述 一个FORTRAN应用程序,用于将NetCDF文件转换为Little-R格式。 Little-R格式是WRF数据同化系统(WRFDA)预处理器(obsproc)可接受的输入格式。 当前,此应用程序仅支持对天气气象站的转换。 安装 NetCDF2LittleR使用cmake构建系统。 NetCDF2LittleR需要构建外部源,例如,通过创建构建目录。 在构建过程中,将创建一个名为convert-littler的二进制文件。 用法 二进制convert-littler需要一个Fortran名称列表作为参数,例如: netcdf2littler --namelist netcdf2littler.namelist 如果未提供任何参数, netcdf2littler尝试使用当前工作目录中的文件netcdf2littler.namelist 。 输入名称列
2021-11-26 22:03:47 51KB convert netcdf wrf littler
1
为解决当被检测图像中具有复杂背景或者含有多人脸时,不能够快速准确的进行人脸检测的问题,本文提出一种基于肤色分割和改进AdaBoost算法的人脸检测方法。首先利用肤色分割方法对样本图像实现图像的预处理,排除样本图像的复杂背景和人体非肤色区域,简化后续的人脸检测工作。然后对AdaBoost算法的弱分类器使用双阈值判决方法,以减少弱分类器个数,提升训练速度;改进权值更新规则,防止训练过程中出现过分配现象。最后对基于肤色分割得到的区域图像利用改进后的Adaboost算法进行最后的精确人脸检测。仿真试验表明,两种算法结合后在训练速度上提升,在检测速度和检测率上有明显提高。
1