:incoming_envelope: 垃圾邮件发送者
:postbox: 垃圾邮件检测器
概要
文本挖掘是一个广阔的领域,随着生成的大量文本数据而越来越受欢迎。 使用机器学习模型已经完成了一些应用程序的自动化,例如情感分析,文档分类,主题分类,文本摘要和机器翻译。
垃圾邮件过滤是文档分类任务的一个示例,该任务涉及将电子邮件分类为垃圾邮件或非垃圾邮件(又名火腿)。
在这个项目中,我将以使用Python和可公开获得的邮件语料库的教程的形式,介绍如何实现这种系统的不同步骤。
输出将是一个API和一个Web应用程序,允许用户输入消息并获得响应(如果是垃圾邮件或火腿)。
数据源
安然电子邮件数据集
链接: :
Python库
对于Fla
1