垃圾邮件
实现一个垃圾短信识别系统,在给定的数据集上验证效果。
短信数据
标签域:1表示垃圾短信/ 0表示正常短信
文本域:短信源文本(进行了一些处理)
分类算法
KNN:K最近邻
LR:逻辑回归
RF:随机森林
DT:决策树
GBDT:梯度提升决策树
SVM:支持向量机
多项式NB:多样式分布朴素贝叶斯
BernoulliNB:伯努利分布朴素贝叶斯
环境依赖
Classfier(模型训练)
(已集成至项目内,无需安装)
站点(演示样本)
项目结构
.
├──Classfier(模型训练)
│ ├── DataProcess(数据预处理)
│ │ ├── jieba(结巴分词库)
│ │ ├── DataPreprocess.py(数据预处理)
│ │ └── message.txt(训练数据)
│ │
│ └── Classifiers.py(分类器)
│
2021-11-22 09:27:40
49.68MB
系统开源
1