实现了高斯、多项式、伯努利三种朴素贝叶斯模型,能够处理离散型数据和连续型数据,并提供预测结果概率。对于像鸢尾花这类的连续型数据可以直接采用MyGaussianNB预测。离散型数据采用MyMultinomialNB预测。离散型数据,且特征值只有0,1两种取值情况的采用MyBernoulliNB预测。三种模型都可以通过score方法评估模型准确率,都可以通过predict_proba方法输出预测结果概率。 此外,为了优化和改进模型,使MyMultinomialNB和MyBernoulliNB能够预测连续型数据,还实现了基于numpy和pandas的分箱函数MyDiscretizer以及二值化函数MyBinarizer。
2022-05-04 04:55:43 47KB 人工智能 python 朴素贝叶斯算法
1
贝叶斯分类算法是统计学的一种概率分类方法,朴素贝叶斯分类是贝叶斯分类中最简单的一种。其分类原理就是利 用贝叶斯公式根据某特征的先验概率计算出其后验概率,然后选择具有最大后验概率的类作为该特征所属的类。之所以称之为”朴素”,是因为贝叶斯分类只做最原始、最简单的假设:所有的特征之间是统计独立的。 朴素贝叶斯法(Naive Bayes model)是基于贝叶斯定理与特征条件独立假设的分类方法。 最为广泛的两种分类模型是决策树模型(Decision Tree Model)和朴素贝叶斯模型(Naive Bayesian Model,NBM)。和决策树模型相比,朴素贝叶斯分类器(Naive Bayes Classifier 或 NBC)发源于古典数学理论,有着坚实的数学基础,以及稳定的分类效率。同时,NBC模型所需估计的参数很少,对缺失数据不太敏感,算法也比较简单。理论上,NBC模型与其他分类方法相比具有最小的误差率。但是实际上并非总是如此,这是因为NBC模型假设属性之间相互独立,这个假设在实际应用中往往是不成立的,这给NBC模型的正确分类带来了一定影响
2022-04-27 16:05:48 1.46MB 算法 机器学习 数据结构 人工智能
1
朴素贝叶斯算法学习笔记。
2022-04-27 15:01:54 24KB 朴素贝叶斯 算法
1
提出了一种利用支持向量机改进的朴素贝叶斯算法——TSVM-NB算法。首先利用NB算法对样本集进行初次训练,利用支持向量机构造一个最优分类超平面,每个样本根据与其距离最近样本的类型是否相同进行取舍,这样既降低样本空间规模,又提高每个样本类别的独立性,最后再次用朴素贝叶斯算法训练样本集从而生成分类模型。仿真实验结果表明,该算法在样本空间进行取舍过程当中消除了冗余属性,可以快速得到分类特征子集,提高了垃圾邮件过滤的分类速度、召回率和正确率。
1
在学习《数据科学导引》第四章分类算法——决策树及朴素贝叶斯时可以参考本课件,基本原理通俗易懂,并举了相关例子,在决策树剪枝部分对课本内容做了补充,有兴趣可以翻阅。 汇报前查阅了很多相关资料,进行了整合和总结,如果有不甚清晰的地方可以私聊探讨,本人在课堂上对本部分做讲解的时候收到了很好的反响。 如果有不同的见解及学习方法,欢迎在评论区留言提问或提出建议。
2022-04-21 13:05:16 36.82MB 决策树 机器学习 朴素贝叶斯算法
1
1、内容概要:本资源主要基朴素贝叶斯算法实现垃圾邮件过滤分类,适用于初学者学习文本分类使用。 2、主要内容:邮件数据集email,email文件夹下有两个文件夹ham和spam,其中ham文件夹下的txt文件为正常邮件,spam文件下的txt文件为垃圾邮件;停用词文件stopwords_cn.txt;Naive_Bay.py 朴素贝叶斯算法实现源码;Email_NB.py垃圾邮件分类实现源码。
1、内容概要:本资源主要基朴素贝叶斯算法实现新闻分类,适用于初学者学习文本分类使用。 2、新闻分类源码实现过程:将数据集划分为训练集和测试集;使用jieba模块进行分词,词频统计,停用词过滤,文本特征提取,将文本数据向量化,使用朴素贝叶斯算法进行分类。 3、主要内容:搜狗新闻数据集SogouC,标签包括财经、IT、健康、体育、旅游、教育、招聘、文化和军事;停用词文件stopwords_cn.txt;Naive_Bay.py 朴素贝叶斯算法实现源码;News_NB.py新闻分类实现源码。
2022-04-17 16:08:07 185KB 朴素贝叶斯算法 机器学习 新闻分类
mahout中的贝叶斯算法的拓展开发包,提供了相关接口可以供用户调用,直接即可跑出结果,相关运行方式参考blog《mahout贝叶斯算法开发思路(拓展篇)》
2022-04-16 21:41:00 87KB mahout 贝叶斯算法
1
python语言实现基于朴素贝叶斯算法的垃圾邮件过滤器-附件资源
2022-04-09 14:20:55 23B
1
基于贝叶斯算法的爬虫方法,充分利用贝叶斯网的优势,实现爬虫
2022-04-03 16:59:06 553KB 贝叶斯算法 爬虫 机器学习
1