知识蒸馏在文本方向上的应用 模型相关等内容在有具体介绍。 目录 更新日志 2020.08.28 整理代码结构,抛弃借鉴的Bert模型,增加xlnet模型,预训练xlnet模型效果较差,可以在模型基础上再进行预训练,因此添加了模型预训练代码。 2020.07.15 修复bug,添加textGCN模型(单独训练,模型效果较差)。 2020.07.06 移除模型介绍&部分模型实现,增加使用说明及运行环境。 2020.05.28 增加了直接使用学生模型训练代码,并使用公开测试集完成测试。 运行环境 python 3.7 pytorch 1.1 (BERT模型参考Bert-Chinese-Text-Classification-Pytorch,有较多改动) transformers 3.0.2 torch 1.5.0 使用说明 下载Wikipedia_zh 中文维基百科 预训练词向量放入Knowl
2021-10-03 16:16:24 1.11MB pytorch knowledge-distillation bert Python
1
机器学习案例——基于朴素贝叶斯算法的文本分类(垃圾邮件过滤)的数据集,见本人的这篇博客!!!这个资源是本人搜集的支撑数据包!
2021-10-02 22:22:21 501KB 数据集 机器学习
1
EasyBert 基于Pytorch的Bert应用,包括命名实体识别、情感分析、文本分类以及文本相似度等(后续更新其他方向相关模块),并有相关数据与深度训练优化方式api。各个子项目大都为开源工作,本项目仅做相应处理以及提供一个已训练的预测接口,方便需求者进行快速的使用。本项目仅作为学习与研究使用,若存在侵权行为,请原作者务必联系我进行协商处理。 使用示例 使用前需下载相应的已训练模型,并导入相应位置 模型下载地址: 在此目录下各以需求名命名的文件中提供相应的使用演示,本阶段所训练的模型效果可以满足相应任务的基本需求。 现阶段通过各任务接口的时间相对慢,大都是在模型加载阶段。若想提升相应的速度,请使用者在接受相应精度损失的前提下更换AlBert进行相应任务的重新预训练。 依赖项 环境依赖 python >= 3.7 Pytorch >= 1.14 transformers >= 2.8.0
2021-10-02 19:01:24 720KB Python
1
卷积神经网络,可以很好的实现文本分类或者图像识别
Text-Classification-Pytorch描述此存储库包含PyTorch深度学习框架中各种文本分类模型(如RNN,LSTM,Attention,CNN等)的实现以及详细的文档。Text-Classification-Pytorch描述此存储库包含各种文本的实现PyTorch深度学习框架中的RNN,LSTM,Attention,CNN等分类模型以及每个模型的详细文档。 文本分类是自然语言处理的基本且最重要的任务之一。 在此存储库中,我专注于一个这样的文本分类任务,即情感分析。 到目前为止,我已经介绍了以下六个不同的m
2021-09-24 15:37:08 13KB Python Deep Learning
1
文本分类微博性别分类数据语料库
2021-09-18 14:05:56 53.47MB 分类 数据 语料库 微博
1
朴素贝叶斯完成文本分类,包含现在常用的文档、单词、混合 3种模型。引入了拉普拉斯平滑技术,通俗易懂。
1
Multi_Label_TextCNN textcnn多标签文本分类
2021-09-16 17:25:43 15KB Python
1
关键词的提取是进行计算机自动文本分类和其他文本数据挖掘应用的关键。系统从语言的词性角度考虑,对传统的最大匹配分词法进行了改进,提出一种基于动词、虚词和停用词三个较小词库的快速分词方法(FS),并利用TFIDF算法来筛选出关键词以完成将Web文档进行快速有效分类的目的。实验表明,该方法在不影响分类准确率的情况下,分类的速度明显提高。
1