复旦大学谭松波中文文本分类语料库,资源免积分下载,仅供大家学习使用,这个数据集到底怎么用我也没试过。
2021-05-08 09:14:37 1.14MB 中文分类语料
1
文本分类语料库训练集,供学习测试使用。新闻类语料(已标签分类),包含经济、交通、教育、环境、体育、医药等类目共上千份新闻文本。
1
做毕设自用的中文新闻文本分类语料库,整理自搜狗新闻和清华新闻语料,共八个类别,每类已分好4000条训练集和1000条测试集。附赠一份停用词表,综合了哈工大停用词及川大停用词。
2021-04-12 12:47:48 47.93MB 文本分类 语料库 数据集 已处理
1
训练集
2021-03-02 19:04:30 144.1MB 文本分类
1
基于【谭松波ChnSentiCorp-Htl-ba-4000: 平衡语料,正负类各2000篇】的【改良版】语料库。原语料库夹杂着许多重复评论、垃圾评论,以及被错误分类的评论,影响分类模型的评价指数。本语料库4000评论都已经过人工整理,耗时三天,用作训练集获得的模型质量更高。经测非常好用!
2020-11-24 21:03:07 1.6MB 情感分析 文本分类 语料库
1
这是一个文本分类的语料库,主要是用于文本分类,主旨句提取,关键词提取等等应用。
2019-12-21 22:15:30 158KB 文本分类;语料库;主旨句;
1
实现文本分类的主要包括几个步骤文本分词处理,特征选择,特征权重计算,文本特征向量表示,基于训练文本的特征向量数据训练SVM模型,对于测试集进行特征向量表示代入训练得到的svm模型中进行预测分类,达到93%的准确率
2019-12-21 21:59:17 26.06MB 文本分类
1
搜狐新闻分类语料库,主要包含 0 汽车 1 财经 2 IT 3 健康 4 体育 5 旅游 6 教育 7 招聘 8 文化 9 军事 十个分类,共50多万条记录
2019-12-21 21:54:07 65.37MB 搜狐 语料库 分类
1
搜狗实验室新闻分类语料库,主要有10个分类,共50多万条记录 0 汽车 1 财经 2 IT 3 健康 4 体育 5 旅游 6 教育 7 招聘 8 文化 9 军事
2019-12-21 21:54:07 25.78MB 搜狗 语料库 分类
1
中文文本分类语料(复旦大学)-训练集和测试集。测试语料共9833篇文档;训练语料共9804篇文档。使用时请注明来源(复旦大学计算机信息与技术系国际数据库中心自然语言处理小组)。
2019-12-21 21:50:45 106.15MB 中文文本分类 语料库 测试集 训练集
1