使用朴素贝叶斯的垃圾邮件分类器 垃圾邮件检测是NLP的主要应用之一。 所有主要的电子邮件服务提供商都内置了垃圾邮件检测系统,并将这些邮件自动分类为“垃圾邮件”。 在这里,基于我们对模型的训练,朴素贝叶斯算法用于创建一个模型,该模型可以将数据集SMS消息分类为垃圾邮件或非垃圾邮件。 能够识别垃圾邮件是一个二进制分类问题,因为邮件被分类为“垃圾邮件”或“非垃圾邮件”,别无其他。 同样,这是一个有监督的学习问题,正如我们知道要预测的那样。 我们将标记的数据集输入模型中,以供将来进行预测,该模型可以从中学习。 使用最初编译并发布在UCI机器学习存储库中的数据集,该库具有用于实验研究目的的非常好的数据集。
2021-05-09 05:05:21 14KB JupyterNotebook
1
该数据集内容为垃圾邮件分类数据集,用于自然语言处理>02.朴素贝叶斯-垃圾邮件分类中的案例数据,该数据集仅供参考
2021-05-08 09:27:55 119KB 朴素贝叶斯算法
1
具有中文垃圾邮件,正常邮件,测试邮件等资料,可以用于朴素贝叶斯分类来检测垃圾邮件
2021-05-07 17:13:24 17.06MB 机器学习
1
打包Matlab博士论文关于垃圾邮件分类-基于文本分类技术的垃圾邮件识别系统.pdf 改进的贝叶斯分类对垃圾邮件识别探讨.pdf 基于NP的垃圾邮件分析系统的设计与实现.pdf 基于文本分类技术的垃圾邮件识别系统.pdf 基于信息熵和决策分类技术的邮件识别研究.pdf 简体中文垃圾邮件分类的实验设计及对比研究.pdf 结合词相关特征与流行学习的中文问句分类.pdf 一种基于支持向量机的垃圾邮件识别方法.pdf 基本都是去年的论文,我去国家图书馆偷来的。那里清华同方还有各种数据库可以一天上网半小时偷。。。
2021-05-04 23:35:43 284KB matlab
1
基于贝叶斯公式的垃圾邮件分类 包含邮件数据以及R语言代码,有视频演示,有讲解ppt
2021-04-17 15:31:42 30.60MB 垃圾邮件 贝叶斯 R语言
1
CNN 中文文本挖掘 文本分类 python 深度学习 机器学习 CNN 中文文本挖掘 文本分类 python 深度学习 机器学习
2021-04-06 09:02:57 12.23MB 垃圾邮件分类 CNN 机器学习
1
垃圾邮件分类 K最近邻居分类器: Accuracy: 93.x% 决策树分类器: Accuracy: 93-94% 朴素贝叶斯分类器: Accuracy: 96.x% Ada-Boost分类器: Accuracy: 96.x% 支持向量机: Accuracy: 97.x% 随机森林分类器: Accuracy: 97-98.x% 调整参数可能会导致结果变化
1
采用朴素贝叶斯的学习方法对垃圾邮件进行判别分类。程序可在Matlab中运行。注意:程序代码在压缩包中的Homework 1 solution.pdf 中!
2021-03-31 14:03:06 603KB 贝叶斯 垃圾邮件 matlab
1
中文垃圾邮件项目: 数据集分为:ham_data.txt 和 Spam.data.txt , 对应为 正常邮件和垃圾邮件 其中每行代表着一个邮件
2021-02-25 20:49:55 1.2MB 文本分类
1
这是我研究生的一个作业,要用贝叶斯分类器去实现垃圾邮件的分类。 第一次是用c语言实现。 第二次用Java,并且用了哈希表,用以保证其计算速度
2021-02-02 15:34:15 617KB 贝叶斯分类器 Java C 哈希表
1