• NLP框架介绍
  • 文本分类
2022-09-06 18:01:09 4.55MB 文本分类 NLP
1
基于attention文本分类代码基于attention文本分类代码基于attention文本分类代码
(外 Q1 2022)基于深度学习的文本分类:综述 (外 Q1 2022)基于深度学习的行为识别概述
2022-08-30 21:05:39 9.35MB 深度学习
1
包含IG,MI,CHI等降维算法和NB,CENTROID,SVM分类算法
2022-08-17 14:20:00 4.1MB 文本分类
1
使用MIMIC-IV中的影像报告数据,基于pytorch搭建transformer神经网络,使用gensim的word2vec包训练词向量配合pytorch使用,进行英文影像报告的分类。 更加详细的资源介绍参见https://blog.csdn.net/weixin_46523923/article/details/122644174
2022-08-14 09:08:41 2.96MB pytorch word2vec transformer python
1
NLP实战之中文文本分类
2022-08-08 09:06:40 8.75MB NLP
1
中文文本分类语料-测试集下载 是测试集,训练集请见我的资源 本语料库由复旦大学李荣陆提供。test_corpus.rar为测试语料,共9833篇文档;train_corpus.rar为训练语料,共9804篇文档,两个预料各分为20个相同类别。训练语料和测试语料基本按照1:1的比例来划分。
2022-07-21 10:16:29 52.72MB 大数据 文本分析 文本训练 机器学习
1
Quora Duplicate Questions Dataset 是用于判别文本中问题对是否重复的数据集,其被用于文本分类研究,旨在为任何人提供训练和测试语义等效模型的机会。 该数据集由超过 400,000 行潜在问题重复对组成,每行包含问题的 ID、问题的完整文本以及指示该行是否包含重复对的二进制值。 该数据集由 Quora 团队于 2017 年发布,主要发布人有 Shankar Iyer、Nikhil Dandekar 和 Kornél Csernai。
2022-07-13 16:05:22 12.35MB 数据集
用于文本分类的改进KNN算法.pdf
2022-07-12 09:13:04 332KB 文档资料