这个链接是训练集,测试集自己去搜有免费的,明明应该是免费的东西,有几个智障非要收钱,然后我才发现,现在csdn不能免费了?最低是2资源竟然? 分享一个免费的链接链接:https://pan.baidu.com/s/1833mT2rhL6gBMlM0KnmyKg 密码:zyxa 要是想打赏下载那个2c币的也行,谢谢老铁 本语料库由复旦大学李荣陆提供。test_corpus.rar为测试语料,共9833篇文档;train_corpus.rar为训练语料,共9804篇文档,两个预料各分为20个相同类别。训练语料和测试语料基本按照1:1的比例来划分。使用时尽量注明来源(复旦大学计算机信息与技术系国际数据库中心自然语言处理小组)。文件较大(训练测试各50多兆),下载时请耐心等待。
2021-06-30 10:05:23 56MB 中文文本分类 文本分类语料
1
1、资源中有语料,本语料库由复旦大学李荣陆提供。test_corpus为测试语料,共9833篇文档;train_corpus为训练语料,共9804篇文档,两个预料各分为20个相同类别。训练语料和测试语料基本按照1:1的比例来划分。使用时尽量注明来源(复旦大学计算机信息与技术系国际数据库中心自然语言处理小组)。 2、资源中还附有一份停用词。
2021-06-14 10:38:46 86.75MB 中文文本分类 文本分类 语料 停用词
1
answer文件夹为测试语料,共9833篇文档;train文件夹为训练语料,共9804篇文档,分为20个类别。训练语料和测试语料基本按照1:1的比例来划分。收集工作花费了不少人力和物力,所以请大家在使用时尽量注明来源(复旦大学计算机信息与技术系国际数据库中心自然语言处理小组)。文件较大(训练测试集压缩包各50多兆)
2021-06-01 19:28:39 105.93MB 机器学习 文本分类 分类语料 中文语料库
1
复旦大学谭松波中文文本分类语料库,资源免积分下载,仅供大家学习使用,这个数据集到底怎么用我也没试过。
2021-05-08 09:14:37 1.14MB 中文分类语料
1
复旦谭松波的,别人辛苦整理,免费发布的东西,拿过来自己赚积分,绝了 数据说明 answer.rar为测试语料,共9833篇文档; train.rar为训练语料,共9804篇文档,分为20个类别。 训练语料和测试语料基本按照1:1的比例来划分。 数据来源 复旦大学计算机信息与技术系国际数据库中心自然语言处理小组 问题描述 适合NLP学习使用
2021-04-13 18:43:26 230.73MB 谭松波中文文本分类
1
复旦大学中文文本分类语料.xlsx
2021-03-16 15:24:30 50.67MB 语料 NLP
1
文本分训练和测试集,每个类别2000条新闻,简单做分类,测试效果 是足够了
2020-02-04 03:16:52 8.3MB 文本分类语料
1
中文文本分类语料(复旦)-训练集和测试集 这个链接是训练集,本语料库由复旦大学李荣陆提供。test_corpus为测试语料,共9833篇文档;train_corpus为训练语料,共9804篇文档,两个预料各分为20个相同类别。训练语料和测试语料基本按照1:1的比例来划分。使用时尽量注明来源(复旦大学计算机信息与技术系国际数据库中心自然语言处理小组)。文件较大,下载时请耐心等待。
2019-12-21 22:04:21 101.81MB 文本分类 数据集 复旦 中文
1
4万条微博数据,详细分为21类
2019-12-21 21:36:01 10.16MB 微博 分类 语料
1
NLPCC2014情感分类语料集+已经标注好+中文,主要是够购物相关的评论。
2019-12-21 20:53:19 10.71MB 情感分析 正负面 语料集
1