在学习《数据科学导引》第四章分类算法——决策树及朴素贝叶斯时可以参考本课件,基本原理通俗易懂,并举了相关例子,在决策树剪枝部分对课本内容做了补充,有兴趣可以翻阅。 汇报前查阅了很多相关资料,进行了整合和总结,如果有不甚清晰的地方可以私聊探讨,本人在课堂上对本部分做讲解的时候收到了很好的反响。 如果有不同的见解及学习方法,欢迎在评论区留言提问或提出建议。
2022-04-21 13:05:16 36.82MB 决策树 机器学习 朴素贝叶斯算法
1
1、内容概要:本资源主要基朴素贝叶斯算法实现垃圾邮件过滤分类,适用于初学者学习文本分类使用。 2、主要内容:邮件数据集email,email文件夹下有两个文件夹ham和spam,其中ham文件夹下的txt文件为正常邮件,spam文件下的txt文件为垃圾邮件;停用词文件stopwords_cn.txt;Naive_Bay.py 朴素贝叶斯算法实现源码;Email_NB.py垃圾邮件分类实现源码。
1、内容概要:本资源主要基朴素贝叶斯算法实现新闻分类,适用于初学者学习文本分类使用。 2、新闻分类源码实现过程:将数据集划分为训练集和测试集;使用jieba模块进行分词,词频统计,停用词过滤,文本特征提取,将文本数据向量化,使用朴素贝叶斯算法进行分类。 3、主要内容:搜狗新闻数据集SogouC,标签包括财经、IT、健康、体育、旅游、教育、招聘、文化和军事;停用词文件stopwords_cn.txt;Naive_Bay.py 朴素贝叶斯算法实现源码;News_NB.py新闻分类实现源码。
2022-04-17 16:08:07 185KB 朴素贝叶斯算法 机器学习 新闻分类
python语言实现基于朴素贝叶斯算法的垃圾邮件过滤器-附件资源
2022-04-09 14:20:55 23B
1
针对垃圾邮件泛滥的问题,本文基于朴素贝叶斯算法构建了邮件过滤系统,并采取平滑、归一化等方法进行数据预处理,提取结构与统计特征,通过邮件地址、邮件内容等多个方式进行过滤。计算机测试后表明本算法提高了垃圾邮件识别精度与准确率。
1
用于机器学习分类的数据集,食品安全新闻数据(.txt格式)
2022-03-17 14:53:21 1.05MB 机器学习 朴素贝叶斯算法
1
朴素贝叶斯算法在 Kaggle 上可用的肥料数据的应用 数据集来源:https ://www.kaggle.com/gdabhishek/counter-prediction
2022-02-21 09:17:44 42KB 算法 kaggle
本资源主要是实现了一个处理连续属性的朴素贝叶斯模型并在UCA上的葡萄酒数据集上进行了测评,另外源码中还包含了与数据集预处理、sklearn中的朴素贝叶斯的对比以及降维可视化等操作且注释详细,是一份完整的机器学习入门源码。
2022-01-10 14:16:27 40KB 机器学习 分类 朴素贝叶斯算法
朴素贝叶斯分类算法的python实现,有需要的同学可以自取。如果积分涨得过高请联系我,我随时可以下调
1
用c++编写的朴素贝叶斯算法,包含零概率处理,数据已在程序中初始化
2021-12-25 04:31:04 59KB 朴素贝叶斯 c++
1