20newsgroups-text-classification 对20 newsgroups 数据集 进行文本分类 方法 基于传统机器学习方法的文本分类 基于深度学习的文本分类 测试结果 传统机器学习方法 MultinomialNB准确率为: 0.8960196779964222 SGDClassifier准确率为: 0.9724955277280859 LogisticRegression准确率为: 0.9304561717352415 SVC准确率为: 0.13372093023255813 LinearSVC准确率为: 0.9749552772808586 LinearSVR准确率为: 0.00022361359570661896 MLPClassifier准确率为: 0.9758497316636852 KNeighborsClassifier准确率为: 0.4584078711
2021-12-29 10:41:48 6KB sklearn text-classification-python Python
1
20 Newsgroups数据集是大约20,000个新闻组文档的集合,在20个不同的新闻组中几乎均匀划分。20 Newsgroups数据集已经成为机器学习技术相关实验的常用数据集,例如文本分类和文本聚类实验。
2021-12-06 16:29:42 44.31MB 自然语言处理 文本分类
1
20个新闻组文本分类 本笔记本包含使用数据集、使用和库的文本分类实现,以及使用库的一些模型解释。 本笔记本随附的博客文章:
1
20newsgroups数据集有三个版本。第一个版本19997是原始的并没有修改过的版本。第二个版本bydate是按时间顺序分为训练(60%)和测试(40%)两部分数据集,不包含交叉文档和新闻组名(新闻组,路径,隶属于,日期)。第三个版本18828不包含交叉文档,只有来源和主题名。
2021-09-13 12:31:29 13.79MB sklearn 文本分类 20newsgroups 20newsbydate
1
new_secaudit (2).log
2021-04-12 18:00:09 14KB newsgroups
1
20 Newsgroups数据.tar.gz
2021-03-22 15:08:06 1.77MB shp 数据集 矢量