文本挖掘 文本分类 数据集 进行文本挖掘,文本分类聚类等研究的可用的数据集
2019-12-21 20:19:44 17.4MB 文本挖掘 文本分类 数据集
1
Newsgroups-18828,google的比较难下,分享给需要的人。
2019-12-21 19:52:56 13.99MB 20news 18828
1
20newsgroup数据集是机器学习中的一个标准数据集。它包含18828个文档,来自于20个不同的新闻组。 该资源包含一个原信息文件和3个目录:test、train和raw。测试和训练目录将整个数据集切分为60%的训练和40%的测试文档。
2019-12-21 18:54:51 39.78MB 20newsgroup 文本挖掘 文本分类 数据集
1
http://blog.csdn.net/abcjennifer/article/details/23615947
2014-04-13 00:00:00 4KB 20newsgroup python
1