:incoming_envelope: 垃圾邮件发送者 :postbox: 垃圾邮件检测器 概要 文本挖掘是一个广阔的领域,随着生成的大量文本数据而越来越受欢迎。 使用机器学习模型已经完成了一些应用程序的自动化,例如情感分析,文档分类,主题分类,文本摘要和机器翻译。 垃圾邮件过滤是文档分类任务的一个示例,该任务涉及将电子邮件分类为垃圾邮件或非垃圾邮件(又名火腿)。 在这个项目中,我将以使用Python和可公开获得的邮件语料库的教程的形式,介绍如何实现这种系统的不同步骤。 输出将是一个API和一个Web应用程序,允许用户输入消息并获得响应(如果是垃圾邮件或火腿)。 数据源 安然电子邮件数据集 链接: : Python库 对于Fla
2022-05-10 22:47:54 42.02MB python flask data-science scikit-learn
1
贝叶斯算法在反垃圾邮件技术中的应用.doc
2022-05-08 14:07:13 55KB 文档资料 算法
spambase/垃圾邮件分类csv数据
2022-05-03 17:05:29 688KB 分类 文档资料 数据挖掘 人工智能
1
提出了一种利用支持向量机改进的朴素贝叶斯算法——TSVM-NB算法。首先利用NB算法对样本集进行初次训练,利用支持向量机构造一个最优分类超平面,每个样本根据与其距离最近样本的类型是否相同进行取舍,这样既降低样本空间规模,又提高每个样本类别的独立性,最后再次用朴素贝叶斯算法训练样本集从而生成分类模型。仿真实验结果表明,该算法在样本空间进行取舍过程当中消除了冗余属性,可以快速得到分类特征子集,提高了垃圾邮件过滤的分类速度、召回率和正确率。
1
1、内容概要:本资源主要基朴素贝叶斯算法实现垃圾邮件过滤分类,适用于初学者学习文本分类使用。 2、主要内容:邮件数据集email,email文件夹下有两个文件夹ham和spam,其中ham文件夹下的txt文件为正常邮件,spam文件下的txt文件为垃圾邮件;停用词文件stopwords_cn.txt;Naive_Bay.py 朴素贝叶斯算法实现源码;Email_NB.py垃圾邮件分类实现源码。
python语言实现基于朴素贝叶斯算法的垃圾邮件过滤器-附件资源
2022-04-09 14:20:55 23B
1
C++编写的Logistic回归分类器过滤垃圾邮件,采用了梯度下降法
2022-04-04 11:42:48 4KB Logistic回归
1
短信_垃圾邮件 这是一个机器学习项目,它使用术语文档矩阵来将SMS归类为垃圾邮件或垃圾邮件。
2022-03-24 05:17:23 2.1MB Python
1
常见机器学习任务的演练-通过使用python和scikit-learn构建Naive Bayes垃圾邮件分类器
1
人工智能与模式识别作业4:基于SVM的垃圾邮件分类.zip
2022-03-23 18:54:17 939KB python
1