由复旦大学李荣陆提供。收集工作花费了不少人力和物力,所以请大家在使用时尽量注明来源(复旦大学计算机信息与技术系国际数据库中心自然语言处理小组)。train.zip为训练语料,共9804篇文档,分为20个类别。answer.zip为训练语料,共9833篇文档,同为20个类别。训练语料与测试语料基本按照1:1的比例来划分
2019-12-21 20:08:37 52.56MB NLP 文本分类 语料库 训练集
1
数据挖掘文本分类语料库(中文)-李荣陆老师的一部分资料
2019-12-21 19:24:06 3.82MB 分类语料
1
搜狗最新文本分类语料库 C000007 汽车 C000008 财经 C000010 IT C000013 健康 C000014 体育 C000016 旅游 C000020 教育 C000022 招聘 C000023 文化 C000024 军事
1