本项目基于朴素贝叶斯和SVM 分类模型,通过对垃圾邮件和正常邮件的数据训练,进行相关词汇词频的统计分析,实现垃圾邮件的识别功能。本项目包括3个模块:数据模块、模型构建、附加功能。需要Python 3.6 及以上配置,在Windows 环境下载Anaconda 完成Python 所需的配置,也可以下载虚拟机在Linux 环境下运行代码。从github 网站下载与python PIL 库配搭使用的文字引擎pytesseract,将PIL 文件夹里的.py 文件,改为相应pytesseract.exe 路径。注册百度云账号,分别建立图像文字识别和图像识别的小程序。
1
垃圾邮件识别的智能算法
2023-10-26 16:10:02 62.26MB 人工智能
1
基于python平台的SVM垃圾邮件识别
2023-01-07 15:31:18 4KB 基于SVM的垃圾邮件识别
1
随着垃圾邮件数量日益攀升,如何有效识别垃圾邮件已成为一项非常重要的课题。为克服k最近邻(k-nea-rest neighbor,kNN)分类法在垃圾邮件识别中的缺陷,本文基于聚类算法提出了一种改进kNN识别方法。首先使用基于最小距离原则的一趟聚类算法将训练邮件集合划分为大小几乎相同的超球体,每个超球体包含一个类别或多个类别的文本;其次,采用投票机制对得到的聚类结果进行簇标识,即以簇中最多文本的类别作为簇的类别,得到的识别模型由具有标识的簇组成;最后,结合最近邻分类思想,对输入的邮件进行自动识别。实验结果表明,该方法可大幅度地降低邮件相似度的计算量,较TiMBL、Nave Bayesian、Stacking等算法效果要好。同时,该方法是一种可增量式更新识别模型的方法,具有一定的实用性。
1
Matlab垃圾邮件识别 包含不同降维算法(PCA、kernel PCA、ISOMAP和LLE)
2022-01-06 18:10:32 10KB Matlab垃圾邮件识别 PCA ISOMAP LLE
1
打包Matlab博士论文关于垃圾邮件分类-一种基于支持向量机的垃圾邮件识别方法.pdf 改进的贝叶斯分类对垃圾邮件识别探讨.pdf 基于NP的垃圾邮件分析系统的设计与实现.pdf 基于文本分类技术的垃圾邮件识别系统.pdf 基于信息熵和决策分类技术的邮件识别研究.pdf 简体中文垃圾邮件分类的实验设计及对比研究.pdf 结合词相关特征与流行学习的中文问句分类.pdf 一种基于支持向量机的垃圾邮件识别方法.pdf 基本都是去年的论文,我去国家图书馆偷来的。那里清华同方还有各种数据库可以一天上网半小时偷。。。
2021-09-29 20:08:25 177KB matlab
1
打包Matlab博士论文关于垃圾邮件分类-改进的贝叶斯分类对垃圾邮件识别探讨.pdf 改进的贝叶斯分类对垃圾邮件识别探讨.pdf 基于NP的垃圾邮件分析系统的设计与实现.pdf 基于文本分类技术的垃圾邮件识别系统.pdf 基于信息熵和决策分类技术的邮件识别研究.pdf 简体中文垃圾邮件分类的实验设计及对比研究.pdf 结合词相关特征与流行学习的中文问句分类.pdf 一种基于支持向量机的垃圾邮件识别方法.pdf 基本都是去年的论文,我去国家图书馆偷来的。那里清华同方还有各种数据库可以一天上网半小时偷。。。
2021-09-29 20:03:23 133KB matlab
1
打包Matlab博士论文关于垃圾邮件分类-基于文本分类技术的垃圾邮件识别系统.pdf 改进的贝叶斯分类对垃圾邮件识别探讨.pdf 基于NP的垃圾邮件分析系统的设计与实现.pdf 基于文本分类技术的垃圾邮件识别系统.pdf 基于信息熵和决策分类技术的邮件识别研究.pdf 简体中文垃圾邮件分类的实验设计及对比研究.pdf 结合词相关特征与流行学习的中文问句分类.pdf 一种基于支持向量机的垃圾邮件识别方法.pdf 基本都是去年的论文,我去国家图书馆偷来的。那里清华同方还有各种数据库可以一天上网半小时偷。。。
2021-05-04 23:35:43 284KB matlab
1