Kaggle-SMS-Spam-Collection-Dataset-:使用NLTK和Scikit-learn分类为垃圾邮件或火腿邮件
1
垃圾邮件分类---安然数据集 使用逻辑回归和计数向量化将Enron数据集的电子邮件分为垃圾邮件或火腿邮件。 注意:彻底评论了Jupyter / IPython笔记本,因此这里不需要广泛的自述文件。
2023-01-25 17:31:14 30.69MB
1
天真贝叶斯垃圾邮件检测器 使用Scikit学习机器学习库将电子邮件分类为垃圾邮件或非垃圾邮件的Python程序。 先决条件 该程序是用Python 3编写的,并使用了Numpy,Pandas和Scikit-learn库。 数据集 该程序利用以csv格式存储的两个数据集。 主要数据集“垃圾邮件或非垃圾邮件”。 该集合是文件'20030228easyham.tar.bz2'和'20030228_spam.tar.bz2'的组合。 这组包含2500个火腿电子邮件示例和500个垃圾电子邮件示例。 该集合包含两列:电子邮件和标签。 电子邮件列中的元素是带有数字值和url的文本字符串,分别用单词“ NUMBER”和“ URL”替换。 标签列中的元素可以具有两个可能的值:如果电子邮件是非垃圾邮件,则为0;如果电子邮件是垃圾邮件,则为1。 辅助数据集包含伪造数据。 此集合遵循主要集合的样式; 两列用于
2023-01-02 22:17:54 1.15MB
1
SMS Spam Collection 是一组为 SMS Spam 研究收集的带有 SMS 标记的消息。它包含 5,574 条消息的一组英文 SMS 消息,根据合法或垃圾邮件进行标记。 这些文件每行包含一条消息。每行由两列组成:v1 包含标签(非垃圾邮件或垃圾邮件),v2 包含原始文本。
2022-12-11 12:26:41 492KB 机器学习 自然语言处理 Python 数据集
1
电子邮件垃圾邮件火腿学习数据集 从不同来源收集的数据集,用于学习SpamAssassin的火腿和垃圾邮件,例如 使用的数据集
2022-09-20 11:36:02 42.67MB
1
matlab实现垃圾邮件分类代码垃圾邮件分类 该项目旨在将垃圾邮件和非垃圾邮件从 . 学习目标是熟悉MATLAB上的CVX工具箱,从头开始编码SVM优化问题。 需要在 MATLAB 上运行代码。 然而,工作可以分为三个步骤—— 1. Feature Extraction 2. Email Classification 3. Parameter Tuning 下面简要说明这些步骤。 但是,请参阅详细说明。 1.特征提取 调用函数 该数据库包含 6,050 封电子邮件,垃圾邮件比率为 30%。 首先,使用 rename.m 代码将所有电子邮件重命名为 .txt 文件。 在所有文件都可以访问后,为每封电子邮件提取一个特征向量,而特征标签为 1 代表垃圾邮件,0 代表非垃圾邮件。 对于此任务,每封电子邮件都会调用 processEmail.m。 然后,它会按照问题描述中给出的规范化程序截取调用 porterStemmer.m 的电子邮件中的单词。 然后将每个词干词与 vocabList.txt 文件中的字典词进行比较。 字典里有1899个字。 初始特征向量是一列零。 如果字典中的单词出现在电子
2022-06-23 14:52:05 2.34MB 系统开源
1
整理好的news、spam、wine-red、wine-white和yeast数据集(csv格式文件),关于其详细内容可以参考文章:https://blog.csdn.net/didi_ya/article/details/125374900 整理不易,谢谢理解~
2022-06-22 16:06:14 5.16MB csv 数据集
SMS_Spam_Classifier:垃圾邮件分类器
2022-05-16 11:54:01 208KB nlp-machine-learning Python
1
安全技术-网络信息-在线社会网络上SPAM行为检测方法研究.pdf
2022-05-02 11:00:31 5.01MB 文档资料 安全 网络
电动机保护继电器概述;D型继电器模块的通用特性;电动机保护继电器模块SPCJ 4D34型。
2022-04-08 14:33:24 3.9MB LabVIEW
1