新闻文本的特征、标签
2021-03-31 09:16:43 236.11MB 数据
1
Stanford Sentiment Treebank 是一个标准情感数据集,主要用于情感分类,其中每个句子分析树的节点均有细粒度的情感注解。 该数据集由斯坦福大学的 NLP 组发布,其中句子和短语共计 239232 条,相较于忽略单词顺序的大多数情绪预测系统,这套深度学习模型建立了基于句子结构 的完整表示。它可根据单词组成的短语判断情绪。 该数据集由斯坦福大学自然语言处理 组于 2013 年发布,相关论文有《Recursive Deep Models for Semantic Compositionality Over a Sentiment Treebank》。
1
基于ELMo词向量的textCNN中文文本分类python代码,ELMo是基于哈工大的HIT-SCIR/ELMoForManyLangs,文本分类代码是基于keras的,有数据有模型有代码。
2021-03-30 10:07:32 383.46MB NLP python 文本分类 ELMo
1
文本分类训练样本集,主要为新闻集,将近万余个样本,已完成标签分类,可用于文本分类模型训练,主要为源文本内容,下载后需要自行中文分词等预处理
2021-03-26 11:54:31 94.35MB 文本分类样本 已分类
1
Scala中文分词+SparkML逻辑回归 实现 中文文本分类
2021-03-25 19:13:54 13.89MB SparkML Scala中文分词
1
介绍了中心向量算法和KNN算法两种分类方法。针对KNN分类方法在计算文本相似度时存在的不足,提出了改进方案。新方案引入了中心向量分类法的思想。通过实验,对改进的KNN算法、中心向量算法和传统的KNN算法应用于文本分类效果进行了比较。实验结果表明,改进的KNN算法较中心向量法和传统的KNN算法在处理中文文本分类问题上有较好的分类效果,验证了对KNN算法改进的有效性和可行性。
2021-03-24 21:34:00 434KB 软件
1
NLP:NLP,韩文,Konlpy,文本分类
2021-03-19 18:09:31 17.86MB JupyterNotebook
1
【自然语言处理】文本分类模型_BiLSTM+Attention_TensorFlow实现,是该博客https://blog.csdn.net/bqw18744018044/article/details/89334729的数据集,可能有点错误,请谨慎使用
2021-03-18 21:41:39 25.57MB 文本分类数据集
1
复旦大学中文文本分类语料.xlsx
2021-03-16 15:24:30 50.67MB 语料 NLP
1
文本级图神经网络用于文本分类
2021-03-12 14:08:16 1.07MB 研究论文
1