复旦大学谭松波中文文本分类语料库,资源免积分下载,仅供大家学习使用,这个数据集到底怎么用我也没试过。
2021-05-08 09:14:37 1.14MB 中文分类语料
1
CNN 中文文本挖掘 文本分类 python 深度学习 机器学习 CNN 中文文本挖掘 文本分类 python 深度学习 机器学习
2021-05-06 08:57:54 13.3MB CNN 中文文本挖掘 文本分类 python
1
TextCNN Pytorch实现中文文本分类 论文 参考 依赖项 python3.5 pytorch == 1.0.0 torchtext == 0.3.1 jieba == 0.39 词向量 (这里用的是Zhihu_QA知乎问答训练出来的单词Word2vec) 用法 python3 main.py -h 训练 python3 main.py 准确率 CNN-rand随机初始化嵌入 python main.py Batch[1800] - loss: 0.009499 acc: 100.0000%(128/128) Evaluation - loss: 0.0000
1
简单高效的Bert中文文本分类模型开发和部署
2021-04-30 12:56:42 659KB Python开发-自然语言处理
1
文本分类语料库训练集,供学习测试使用。新闻类语料(已标签分类),包含经济、交通、教育、环境、体育、医药等类目共上千份新闻文本。
1
复旦谭松波的,别人辛苦整理,免费发布的东西,拿过来自己赚积分,绝了 数据说明 answer.rar为测试语料,共9833篇文档; train.rar为训练语料,共9804篇文档,分为20个类别。 训练语料和测试语料基本按照1:1的比例来划分。 数据来源 复旦大学计算机信息与技术系国际数据库中心自然语言处理小组 问题描述 适合NLP学习使用
2021-04-13 18:43:26 230.73MB 谭松波中文文本分类
1
做毕设自用的中文新闻文本分类语料库,整理自搜狗新闻和清华新闻语料,共八个类别,每类已分好4000条训练集和1000条测试集。附赠一份停用词表,综合了哈工大停用词及川大停用词。
2021-04-12 12:47:48 47.93MB 文本分类 语料库 数据集 已处理
1
基于ELMo词向量的textCNN中文文本分类python代码,ELMo是基于哈工大的HIT-SCIR/ELMoForManyLangs,文本分类代码是基于keras的,有数据有模型有代码。
2021-03-30 10:07:32 383.46MB NLP python 文本分类 ELMo
1
介绍了中心向量算法和KNN算法两种分类方法。针对KNN分类方法在计算文本相似度时存在的不足,提出了改进方案。新方案引入了中心向量分类法的思想。通过实验,对改进的KNN算法、中心向量算法和传统的KNN算法应用于文本分类效果进行了比较。实验结果表明,改进的KNN算法较中心向量法和传统的KNN算法在处理中文文本分类问题上有较好的分类效果,验证了对KNN算法改进的有效性和可行性。
2021-03-24 21:34:00 434KB 软件
1
复旦大学中文文本分类语料.xlsx
2021-03-16 15:24:30 50.67MB 语料 NLP
1