文字分类 文本分类(文本分类)是自然语言处理中的一个重要应用技术,根据文档的内容或主题,自动识别文档所属的预先定义的类别标签。文本分类是很多应用场景的基础,某些垃圾邮件识别,舆情分析,情感识别,新闻自动分类,智能客服机器人的合并分类等等。此处分为两个部分: 第1部分:基于scikit学习机器学习的Python库,对比几个传统机器学习方法的文本分类 第2部分:基于预训练词向量模型,使用Keras工具进行文本分类,用到了CNN 本文语料:,密码:P9M4。更多新闻标注语料,。 预训练词向量模型来自,下载地址: 。 第1部分:基于scikit-learn机器学习的文本分类方法 基于scikit-
2024-06-24 14:49:13 208KB python nlp machine-learning deep-learning
1
搜狗的新闻中文语料库,可用于word2vec训练用的。。。。。。。。。。。。。。。。。。。。。。。。
2021-12-10 15:34:20 45.5MB 中文语料库
1
复旦大学新闻语料库,此为训练集。使用请注明来源:复旦大学计算机信息与科学技术系国际数据库中心自然语言处理小组
2021-09-03 14:47:43 28.32MB 文本分类语料
1
文本分类语料库训练集,供学习测试使用。新闻类语料(已标签分类),包含经济、交通、教育、环境、体育、医药等类目共上千份新闻文本。
1
做毕设自用的中文新闻文本分类语料库,整理自搜狗新闻和清华新闻语料,共八个类别,每类已分好4000条训练集和1000条测试集。附赠一份停用词表,综合了哈工大停用词及川大停用词。
2021-04-12 12:47:48 47.93MB 文本分类 语料库 数据集 已处理
1
人民网新闻语料库,解压后包含人民网,中新网等最新的几百条新闻,txt的形式
2019-12-21 21:16:19 2.31MB txt 语料库
1
15000多篇腾讯新闻,涵盖各个方面,比较全面
2019-12-21 21:05:03 23.66MB 腾讯新闻
1
网易新闻语料库 文本分类 自然语言处理 网上基本找不到哦~~
2019-12-21 20:12:04 37.74MB 网易新闻语料 文本分类 自然语言处理
1
包含2015年一整年的新闻,文件以txt形式存储,是从各大网站上爬取下来的。希望喜欢
2019-12-21 18:55:57 18.09MB 新闻 语料库 分类算法 SVM
1
这是本人自己爬取的今日头条新闻数据。包括了6个类别:军事,体育,娱乐,时尚,汽车,游戏。每个类别有2000左右的数据。包含有新闻的题目,正文。还有一些类别中包含了新闻的发布时间,新闻来源等信息。
2019-12-21 18:53:45 16.56MB 中文新闻 语料库
1