头条新闻文本分类数据集,包括11个类别,近50万条数据,文本内容为新闻标题+提取的关键词,分为训练数据和验证数据两个文件
2021-01-17 15:43:03 12.25MB 文本分类 数据集
1
基于内容的文本分类系统,使用libsvm 进行分类。
2020-12-30 15:13:41 40.58MB svm 文本分类 中文分词 libsvm
1
北邮计算机研一《数据挖掘》文本分类实验.zip
2020-12-29 17:17:08 15KB 数据挖掘
1
基于【谭松波ChnSentiCorp-Htl-ba-4000: 平衡语料,正负类各2000篇】的【改良版】语料库。原语料库夹杂着许多重复评论、垃圾评论,以及被错误分类的评论,影响分类模型的评价指数。本语料库4000评论都已经过人工整理,耗时三天,用作训练集获得的模型质量更高。经测非常好用!
2020-11-24 21:03:07 1.6MB 情感分析 文本分类 语料库
1
主要是读取文本,然后进行分词、词干提取、去停用词、计算词频,有界面,很实用
2020-05-18 23:41:14 70KB 词频计算
1
文本分训练和测试集,每个类别2000条新闻,简单做分类,测试效果 是足够了
2020-02-04 03:16:52 8.3MB 文本分类语料
1
相对比较完整的中文语料库,用于中文本分类的训练预料
2020-01-16 03:05:09 136KB 中文语料库 文本分类
1
这个是Python编写的一个情感文本分析程序,定义两种term weight实现,分别为TF 和BOOL,实现了特征选择算法。文件夹中附带数据集
2020-01-04 03:14:53 509KB Naive Bayes
1
采用深度学习,cnn,rnn 两种方式对新闻类信息。进行分类预测。。。。仅供初学者练习使用
2020-01-03 11:42:23 54.35MB CNN RNN
1
基于文本内容的垃圾邮件过滤程序,VC++6.0, 利用贝叶斯算法进行中文文本分类,过滤垃圾邮件
1