整理自搜狗实验室中的新闻分类。含有金融、体育、军事等11个分类集。
2023-11-24 21:13:33 33.86MB 自然语言处理 新闻分类语料
1
中文文本分类语料-测试集下载 是测试集,训练集请见我的资源 本语料库由复旦大学李荣陆提供。test_corpus.rar为测试语料,共9833篇文档;train_corpus.rar为训练语料,共9804篇文档,两个预料各分为20个相同类别。训练语料和测试语料基本按照1:1的比例来划分。
2022-07-21 10:16:29 52.72MB 大数据 文本分析 文本训练 机器学习
1
包括十个类,环境,计算机,交通,教育,经济,军事,体育,医药,艺术,政治
2022-05-21 17:10:32 2.55MB 文本分类语料
1
这个链接是测试集,训练集请见这个链接: 本语料库由复旦大学李荣陆提供。test_corpus.rar为测试语料,共9833篇文档;train_corpus.rar为训练语料,共9804篇文档,两个预料各分为20个相同类别。训练语料和测试语料基本按照1:1的比例来划分。使用时尽量注明来源(复旦大学计算机信息与技术系国际数据库中心自然语言处理小组)。文件较大(训练测试各50多兆),下载时请耐心等待。
2022-04-26 22:51:22 51.14MB 中文文本分类 文本分类语料
1
文本分类语料,共9833篇文档;train为训练语料,test为测试语料,共9804篇文档,分为20个类别。训练语料和测试语料基本按照1:1的比例来划分;
2022-01-17 14:16:20 105.11MB 复旦 文本分类 语料 文本分类语料
1
本语料库由复旦大学李荣陆提供。test_corpus.rar为测试语料,共9833篇文档;train_corpus.rar为训练语料,共9804篇文档,两个预料各分为20个相同类别。训练语料和测试语料基本按照1:1的比例来划分。(使用时尽量注明来源(复旦大学计算机信息与技术系国)
2021-12-24 15:11:46 52.33MB 文本分类 语料
1
中文自然语言处理文本分类语料,共15个分类,类别包括财经、电竞、房产、国际、教育、军事、科技、旅游、民生、农业、汽车、体育、文化、娱乐、证券
2021-12-19 16:01:45 64.98MB nlp 机器学习 自然语言处理
1
知网期刊公开的文艺、计算机、体育类文章,用于文本分类学习研究
2021-11-17 09:04:05 16.3MB 文本分类语料
1
中文文本分类语料(复旦)-训练集和测试集 这个链接是训练集,本语料库由复旦大学李荣陆提供。test_corpus为测试语料,共9833篇文档;train_corpus为训练语料,共9804篇文档,两个预料各分为20个相同类别。训练语料和测试语料基本按照1:1的比例来划分。使用时尽量注明来源(复旦大学计算机信息与技术系国际数据库中心自然语言处理小组)。文件较大,下载时请耐心等待。
1
复旦大学新闻语料库,此为训练集。使用请注明来源:复旦大学计算机信息与科学技术系国际数据库中心自然语言处理小组
2021-09-03 14:47:43 28.32MB 文本分类语料
1