基于朴素贝叶斯分类器的简单手写体数字识别 .
2021-12-05 13:47:28 352KB 分类器
1
第六章 朴素贝叶斯分类 6.1 朴素贝叶斯分类数学基础 1.贝叶斯定理 假设对于某个数据集,随机变量 C 表示样本为 C 类的概率,F1 表示测试样本某特征出现的概率,套 用基本贝叶斯公式,则如下所示: 上式表示对于某个样本,特征 F1 出现时,该样本被分为 C 类的条件概率。 对于该公式,需要熟知的概念: 先验概率(Prior):P(C)是 C 的先验概率,可以从已有的训练集中计算分为 C 类的样本占所有样本的 比重得出。 证据(Evidence):即上式 P(F1),表示对于某测试样本,特征 F1 出现的概率。同样可以从训练集中 F1 特征对应样本所占总样本的比例得出。 似然(likelihood):即上式 P(F1|C),表示如果知道一个样本分为 C 类,那么他的特征为 F1 的概率是 多少 对于多特征而言: 贝叶斯定理是基于假设的先验概率给定假设下观察到不同数据的概率,提供了一种计算后验概率的方 法 6.2 朴素贝叶斯分类 1.思想基础 对于给出的待分类项,求解在此项出现的条件下各个类别出现的概率,哪个最大,就认为此待分类项 属于哪个类别。 2.假设条件 1)特征之间相互独立 2)每个特征同等重要 3.朴素的概念
2021-12-04 13:24:12 4.91MB 数据挖掘算法 Python
1
朴素贝叶斯分类--R语言应用-附件资源
2021-12-04 12:29:01 106B
1
简介 多项式朴素贝叶斯也是多用于文本处理,其原理和计算的流程和伯努利朴素贝叶斯基本一致,唯一的区别在于单词的计数方式,由《伯努利朴素贝叶斯》一文可知,在文本处理的环节中,我们将单词是否出现在词组作为特征,但在多项式朴素贝叶斯中,我们将单词在词组中出现的次数作为特征,因此只需要更改文中setOfWords2Vec的函数即可,变成如下方式: def bagOfWords2VecMN(vocabList, inputSet): returnVec = [0] * len(vocabList) for word in inputSet: if word in vocab
2021-12-01 21:37:54 67KB python python函数 分类
1
针对朴素贝叶斯分类算法中缺失数据填补问题,提出一种基于改进EM(Expectation Maximization)算法的朴素贝叶斯分类算法。该算法首先根据灰色相关度对缺失数据一个估计,估计值作为执行EM算法的初始值,迭代执行E步M步后完成缺失数据的填补,然后用朴素贝叶斯分类算法对样本进行分类。实验结果表明,改进算法具有较高的分类准确度。并将改进的算法应用于高校教师岗位等级的评定。
2021-11-29 16:06:47 612KB 论文研究
1
这是一个 C++ 的朴素贝叶斯文本分类器库,可以对文本中的垃圾邮件、基因、情感类型进行分类。 自 1950 年代以来,朴素贝叶斯已被广泛研究。 它在 1960 年代初期以不同的名称引入文本检索社区,并且仍然是文本分类的流行(基线)方法,判断文档属于一个类别或另一个类别的问题(例如垃圾邮件或合法,体育或政治等)以词频为特征。 通过适当的预处理,它在该领域具有竞争力,包括支持向量机在内的更先进的方法。它还在自动医疗诊断中得到应用。
2021-11-25 19:55:21 19KB 开源软件
1
朴素的贝叶斯构建垃圾邮件过滤器
2021-11-25 09:35:58 5KB
1
人工智能实验三朴素贝叶斯C++.zip
2021-11-23 19:21:54 12KB 人工智能
1
在VC6.0编译环境下使用C++编写的朴素贝叶斯分类程序
2021-11-23 10:40:36 5.09MB 朴素贝叶斯分类程序(C++)
1
包含25封正常邮件、25封垃圾邮件以及分类器源代码,适合ML初学者使用
2021-11-22 17:42:44 13KB spam ham 朴素贝叶斯 邮件分类器
1