北京大学语料库(1 833 177 字)包含训练和测试集,文本格式的数据,包含utf8和GBK两种格式
2019-12-21 19:53:14 3.55MB 自然语言 语料库
1
微软亚洲研究院语料库(1 089 050 字,训练集和测试集),有UTF8和GBK两种格式
2019-12-21 19:53:14 7.29MB 语料库 自然语言
1
NLP&&CC2013; 微博情绪分析样例数据 测试集和标注 该语料主要用于识别出整条微博所表达的情绪,不是简单的褒贬分类,而是涉及到多个细粒度情绪类别(例如悲伤、忧愁、快乐、兴奋等),属于细粒度的情感分类问题。
2019-12-21 19:29:45 33.4MB 情感分析
1
复旦中文文本分类数据集,包含训练集和测试集,自然语言处理 看论文看到数据堂的复旦中文文本分类语料无法下载,网上找到了训练集和测试集,4积分,良心价
2019-12-21 18:58:39 105.99MB 复旦文本分类 文本分类 中文数据集
1
中文文本分类语料(复旦)训练集+测试集(100M)完整版
2019-12-21 18:58:20 103.25MB 中文文本分类 分类语料 训练集 测试集
1
基于MATLAB的adaboost算法,先对训练集进行训练,然后对测试集进行测试,最后得出采用adaboost算法对样本进行处理的错误率,最后得出比较图形。
2019-12-21 18:52:00 262KB adaboost 训练集 测试集 错误率
1
本语料库由复旦大学李荣陆提供。训练语料和测试语料两个预料各分为20个相同类别。训练语料和测试语料基本按照1:1的比例来划分。使用时尽量注明来源(复旦大学计算机信息与技术系国际数据库中心自然语言处理小组)
2019-12-21 18:51:02 111.24MB 文本分类
1
本资源包含一个Mnist手写体的训练脚本,可在环境配置好的情况下直接训练学习模型,然后可以根据模型输入任意照片,预测结果,直接可用,适合入门者。
2019-12-21 18:50:27 10.26MB Mnist手写体 训练脚本 测试脚本
1
共50.38MB。本语料库由复旦大学李荣陆提供。test_corpus.rar为测试语料,共9833篇文档;train_corpus.rar为训练语料,共9804篇文档,两个预料各分为20个相同类别。训练语料和测试语料基本按照1:1的比例来划分。使用时尽量注明来源(复旦大学计算机信息与技术系国际数据库中心自然语言处理小组)
2019-12-21 18:49:48 51.14MB 文本分类 语料 测试集
1
这个链接是测试集,训练集请见我的资源 本语料库由复旦大学李荣陆提供。test_corpus.rar为测试语料,共9833篇文档;train_corpus.rar为训练语料,共9804篇文档,两个预料各分为20个相同类别。训练语料和测试语料基本按照1:1的比例来划分。使用时尽量注明来源(复旦大学计算机信息与技术系国际数据库中心自然语言处理小组)。文件较大(训练测试各50多兆),下载时请耐心等待。
2017-02-06 00:00:00 51.14MB 中文文本分类 文本分类语料
1