Scikit新闻/邮件文本内容分类数据集缓存文件。用以解决国内开发者下载资源慢的问题。使用的时候将其放入“用户根目录/scikit_learn_data/”下,即可改为使用缓存,从而不用到远程下载。
2024-09-22 11:25:30 14.64MB 机器学习
1
20news是一个英文新闻数据集,包含 20个 类别共 20000篇 新闻文档,可用以进行文档分类和自然语言处理等任务。
2022-06-19 17:23:56 77.05MB 文本分类 NLP 自然语言理解
1
20news-bydate.tar.gz 文本分类 数据集 20news
2022-05-18 16:43:27 13.79MB 文本分类 数据集 20news
1
20news-bydate.tar.gz 文本分类 数据集 20news
2022-03-31 15:36:35 13.79MB 文本分类
1
下载'20news-bydate.pkz', 放到C:\\Users\[Current user]\scikit_learn_data 下边就行,从而解决20newsgroups 数据集导入失败: “no handlers could be fetch_20newsgroups”。
2022-01-31 14:06:16 14.94MB 20newsgroups
1
20 Newsgroups数据集是大约20,000个新闻组文档的集合,在20个不同的新闻组中几乎均匀划分。20 Newsgroups数据集已经成为机器学习技术相关实验的常用数据集,例如文本分类和文本聚类实验。
2021-12-06 16:29:42 44.31MB 自然语言处理 文本分类
1
主要是解决这里的问题:http://blog.csdn.net/mmc2015/article/details/47971253#reply。数据集下载不下来,还是用现成的吧。
2021-11-26 00:43:00 19.57MB 机器学习 20news集
1
在使用sklearn进行文本分类时,我们需要引入数据包。
2019-12-21 19:58:09 14.94MB sklearn
1
Newsgroups-18828,google的比较难下,分享给需要的人。
2019-12-21 19:52:56 13.99MB 20news 18828
1