文本分类入门文章汇总,将十几篇文章集中到一起,看起来方便:)
2021-04-21 19:29:02 124KB 文本分类
1
基于朴素贝叶斯的文本分类,结合了TF-IDF算法和textrank算法
2021-04-18 20:11:01 934KB 文本分类
1
网上很多复旦大学的文本分类数据集,但是训练和测试大多是分开的。 我收集下载重新打包,以方便大家使用。 仅需5个积分,是最便宜的了。
2021-04-17 12:37:02 103.86MB 文本分类 数据集 复旦大学
1
新闻文本分类实战
2021-04-15 19:07:09 13.90MB 新闻分类
1
经典的LSTM分类模型,一种是利用LSTM最后时刻的输出作为高一级的表示,而另一种是将所有时刻的LSTM输出求平均作为高一级的表示.这两种表示都存在一定的缺陷,第一种缺失了前面的输出信息,另一种没有体现每个时刻输出信息的不同重要程度.为了解决此问题,引入 Attention 机制,对 LSTM 模型进行改进,设计了 LSTM-Attention 模型.实验结果表明: LSTM 分类模型比传统的机器学习方法分类效果更好,而引入 Attention 机制后的 LSTM 模型相比于经典的文本分类模型,分类效果也有了一定程度的提升.
2021-04-14 13:05:15 468KB LSTM Attention
1
复旦谭松波的,别人辛苦整理,免费发布的东西,拿过来自己赚积分,绝了 数据说明 answer.rar为测试语料,共9833篇文档; train.rar为训练语料,共9804篇文档,分为20个类别。 训练语料和测试语料基本按照1:1的比例来划分。 数据来源 复旦大学计算机信息与技术系国际数据库中心自然语言处理小组 问题描述 适合NLP学习使用
2021-04-13 18:43:26 230.73MB 谭松波中文文本分类
1
做毕设自用的中文新闻文本分类语料库,整理自搜狗新闻和清华新闻语料,共八个类别,每类已分好4000条训练集和1000条测试集。附赠一份停用词表,综合了哈工大停用词及川大停用词。
2021-04-12 12:47:48 47.93MB 文本分类 语料库 数据集 已处理
1
SemEval2014情感分析的数据集,包含Restaurants和LapTops两类。训练集、测试集、验证集。
2021-04-11 19:58:36 460KB 文本分类
1
pyhanlp 词性汇总
2021-04-11 18:12:14 26KB NLP pyhanlp 文本分类
1
介绍文本分类中特征提取方法的比较与分析,信息增益、卡方等方法
2021-04-08 21:30:48 479KB 文本分类
1