ml-projects:基于ML的项目,例如垃圾邮件分类,时间序列分析,使用随机森林进行文本分类,深度学习,贝叶斯,Python中的Xgboost
2022-05-19 01:00:19 9KB nlp docker machine-learning deep-learning
1
本文基于朴素贝叶斯构建一个分类垃圾邮件的模型,研究对象是英文的垃圾邮件。 邮件内容保存在txt文件中,其中分为训练样本train和测试样本test。 在训练样本中正常邮件命名为:pos;垃圾邮件命名为:neg。 同时,可以将待分类的测试样本放入测试文件test中的对于pos,或者neg下,用来进行测试,如果是垃圾邮件则类别为0,反之类别为1。 在朴素贝叶斯法进行垃圾邮件的分类的思想中:有一个方法与一个假设:   贝叶斯定理:求解p(c|x)的问题变成了求解p(x|c)的问题   特征条件独立假设 :X的n个特征在某类确定的条件下都是条件独立的。 具体可以看:[监督学习] 朴素贝叶斯法. 在Gi
2022-05-16 16:30:45 61KB 分类 朴素贝叶斯 贝叶斯
1
SMS_Spam_Classifier:垃圾邮件分类器
2022-05-16 11:54:01 208KB nlp-machine-learning Python
1
:incoming_envelope: 垃圾邮件发送者 :postbox: 垃圾邮件检测器 概要 文本挖掘是一个广阔的领域,随着生成的大量文本数据而越来越受欢迎。 使用机器学习模型已经完成了一些应用程序的自动化,例如情感分析,文档分类,主题分类,文本摘要和机器翻译。 垃圾邮件过滤是文档分类任务的一个示例,该任务涉及将电子邮件分类为垃圾邮件或非垃圾邮件(又名火腿)。 在这个项目中,我将以使用Python和可公开获得的邮件语料库的教程的形式,介绍如何实现这种系统的不同步骤。 输出将是一个API和一个Web应用程序,允许用户输入消息并获得响应(如果是垃圾邮件或火腿)。 数据源 安然电子邮件数据集 链接: : Python库 对于Fla
2022-05-10 22:47:54 42.02MB python flask data-science scikit-learn
1
贝叶斯算法在反垃圾邮件技术中的应用.doc
2022-05-08 14:07:13 55KB 文档资料 算法
spambase/垃圾邮件分类csv数据
2022-05-03 17:05:29 688KB 分类 文档资料 数据挖掘 人工智能
1
提出了一种利用支持向量机改进的朴素贝叶斯算法——TSVM-NB算法。首先利用NB算法对样本集进行初次训练,利用支持向量机构造一个最优分类超平面,每个样本根据与其距离最近样本的类型是否相同进行取舍,这样既降低样本空间规模,又提高每个样本类别的独立性,最后再次用朴素贝叶斯算法训练样本集从而生成分类模型。仿真实验结果表明,该算法在样本空间进行取舍过程当中消除了冗余属性,可以快速得到分类特征子集,提高了垃圾邮件过滤的分类速度、召回率和正确率。
1
1、内容概要:本资源主要基朴素贝叶斯算法实现垃圾邮件过滤分类,适用于初学者学习文本分类使用。 2、主要内容:邮件数据集email,email文件夹下有两个文件夹ham和spam,其中ham文件夹下的txt文件为正常邮件,spam文件下的txt文件为垃圾邮件;停用词文件stopwords_cn.txt;Naive_Bay.py 朴素贝叶斯算法实现源码;Email_NB.py垃圾邮件分类实现源码。
python语言实现基于朴素贝叶斯算法的垃圾邮件过滤器-附件资源
2022-04-09 14:20:55 23B
1
C++编写的Logistic回归分类器过滤垃圾邮件,采用了梯度下降法
2022-04-04 11:42:48 4KB Logistic回归
1