用贝叶斯进行分词,有结果文档。课业作业 很全面~~~~~~
2021-12-14 14:16:20 30KB 贝叶斯 cnews 文本处理
1
CNews_sum_train训练集,经过简单数据清洗
2021-11-11 16:13:39 556.62MB 中文摘要数据集
1
cnews,新闻类别识别训练、测试数据集
2021-06-17 15:03:21 66.11MB 数据集
1
cnews.test.txt
2021-06-07 09:06:54 26.23MB Python
1
cnews中文文本分类数据集;由清华大学根据新浪新闻RSS订阅频道2005-2011年间的历史 数据筛选过滤生成,训练过程见我的博客;
2021-06-02 20:25:12 42.97MB cnews 深度学习 数据集
1
数据集是清华大学根据新浪新闻RSS订阅频道2005-2011年间的历史数据筛选过滤生成。数据集一共包括10类新闻,每类新闻65000条文本数据,训练集50000条,测试集10000条,验证集5000条。
2021-04-28 20:49:58 61.06MB 文本分类
1
CNEWS新闻文档分类数据,其中14个候选分类类别:财经、彩票、房产、股票、家居、教育、科技、社会、时尚、时政、体育、星座、游戏、娱乐
2021-03-27 20:33:30 65.32MB 数据集
THUCNews是根据新浪新闻RSS订阅频道2005~2011年间的历史数据筛选过滤生成,包含74万篇新闻文档(2.19 GB),均为UTF-8纯文本格式。我们在原始新浪新闻分类体系的基础上,重新整合划分出14个候选分类类别:财经、彩票、房产、股票、家居、教育、科技、社会、时尚、时政、体育、星座、游戏、娱乐。
2019-12-21 21:53:22 61.06MB 自然语言处理 中文数据集
1