垃圾短信识别 源码+模型+数据集全套,个人毕设项目,可直接运行
2023-10-25 15:05:11 17.67MB python 软件/插件 数据集 垃圾短信识别
1
朴素贝叶斯分类之垃圾短信识别.7z
2022-07-13 16:04:54 156KB 数据集
机器学习入门:手写数字识别,声呐分类,垃圾短信识别,鸢尾花分类 机器学习入门:手写数字识别,声呐分类,垃圾短信识别,鸢尾花分类 本系列代码是大多数初学者刚刚接触机器学习时会运行的代码,这些代码结构简单,原理清晰,易于实现。 项目均由jupyter notebook编写,适合分步骤运行,帮助理解每一步的功能。
2022-05-09 11:04:30 622KB 机器学习 分类 人工智能 数据挖掘
基于机器学习的垃圾短信识别应用.pdf
2021-12-05 22:17:19 1.53MB 机器学习 参考文献 专业指导
本文采用对分类的样本数据短信文本词频统计,转化为tf-idf权值向量(即文本向量表示法),代入高斯贝叶斯模型进行训练。内有详细代码和实现过程。
1
垃圾邮件 实现一个垃圾短信识别系统,在给定的数据集上验证效果。 短信数据 标签域:1表示垃圾短信/ 0表示正常短信 文本域:短信源文本(进行了一些处理) 分类算法 KNN:K最近邻 LR:逻辑回归 RF:随机森林 DT:决策树 GBDT:梯度提升决策树 SVM:支持向量机 多项式NB:多样式分布朴素贝叶斯 BernoulliNB:伯努利分布朴素贝叶斯 环境依赖 Classfier(模型训练) (已集成至项目内,无需安装) 站点(演示样本) 项目结构 . ├──Classfier(模型训练) │ ├── DataProcess(数据预处理) │ │ ├── jieba(结巴分词库) │ │ ├── DataPreprocess.py(数据预处理) │ │ └── message.txt(训练数据) │ │ │ └── Classifiers.py(分类器) │
2021-11-22 09:27:40 49.68MB 系统开源
1
机器学习之-基于文本内容的垃圾短信识别-所需数据.rar
2021-09-05 20:49:13 30.8MB 机器学习
1
这里免费提供基于文本内容的垃圾短信识别中所需数据包括词云图片、垃圾短信数据、和自定义字典等,希望对您有帮助
2021-08-20 10:38:13 32.63MB 垃圾短信识别 朴素贝叶斯 垃圾短信
1
机器学习之基于文本内容的垃圾短信识别的所需数据(即所需要的原始数据message80W1、自定义的词典newdic1、停用词stopword 和轮廓图duihuakuan)
1
国科大 徐君 网络数据挖掘 大作业 个人报告+代码+数据,可参考 README 运行环境: Python 2.7.12 jieba 0.39 numpy 1.13.3 scikit-learn 0.19.1 scipy 1.0.0 请参照此运行环境进行运行前配置。 1.运行TextProcess.py获得classifiedLabel.txt、trainSetMsg.txt以及testSetMsg.txt,得到文本处理后的规则文本数据文件; 2.运行crossValidation.py进行交叉验证; 3.其中SVM算法运行时间较长(6-7小时左右),可以注释掉或者减少数据规模来测试; 4.可调用分类器中的predict方法来利用训练后的分类器进行分类预测(垃圾短信识别)。
2021-05-07 18:27:55 66.33MB 网络数据挖掘 垃圾短信识别 分类器
1