使用朴素贝叶斯的垃圾邮件分类器
垃圾邮件检测是NLP的主要应用之一。 所有主要的电子邮件服务提供商都内置了垃圾邮件检测系统,并将这些邮件自动分类为“垃圾邮件”。
在这里,基于我们对模型的训练,朴素贝叶斯算法用于创建一个模型,该模型可以将数据集SMS消息分类为垃圾邮件或非垃圾邮件。
能够识别垃圾邮件是一个二进制分类问题,因为邮件被分类为“垃圾邮件”或“非垃圾邮件”,别无其他。 同样,这是一个有监督的学习问题,正如我们知道要预测的那样。 我们将标记的数据集输入模型中,以供将来进行预测,该模型可以从中学习。
使用最初编译并发布在UCI机器学习存储库中的数据集,该库具有用于实验研究目的的非常好的数据集。
1