20newsgroup数据集是机器学习中的一个标准数据集。它包含18828个文档,来自于20个不同的新闻组。 该资源包含一个原信息文件和3个目录:test、train和raw。测试和训练目录将整个数据集切分为60%的训练和40%的测试文档。
2019-12-21 18:54:51 39.78MB 20newsgroup 文本挖掘 文本分类 数据集
1
50000条新闻文本数据集,文本有9类。可用于文本分类模型训练。
2019-12-21 18:53:33 124.06MB 深度学习 训练数据集 LSTM数据集
1