基于CNN的中文文本分类算法(可应用于垃圾邮件过滤、情感分析等场景)
2024-04-14 09:54:07 13.33MB
1
可直接运行, 1、内容概要:本资源主要基于XGBoost与LightGBM实现文本分类,适用于初学者学习文本分类使用。 2、数据集为电商真实商品评论数据,主要包括训练集data_train,测试集data_test ,经过预处理的训练集clean_data_train,训练好的word2vec词向量模型w2v_model.pkl和中文停用词表stopwords.txt,可用于模型训练和测试,详细数据集介绍见商品评论情感数据说明文档。 3、源代码:word2vec_analysis.py 是基于Word2Vec进行词向量的生成,采用向量平均求得句向量,然后分别构建RandomForest和GBDT分类模型进行文本分类。 4、源代码:xgboost_model.py是基于xgboost模型对文本进行分类。 5、源代码:lightGBM_model.py是基于lightGBM模型对文本进行分类。
2024-04-10 20:39:49 37.99MB 数据集
1
在LDA建模的基础上,使用各种分类器对文本分类,即利用LDA的建模结果提高分类效率和精度。
2024-03-25 09:50:13 1.36MB
1
自然语言处理+Transformer+文本分类+情感分析 自然语言处理+YOLO+图像描述+图文生成 使用Transformer模型进行文本分类和情感分析的教程,介绍了Transformer模型的基本原理、结构和实现方法,以及如何使用Hugging Face的Transformers库和PyTorch框架来构建、训练和评估文本分类模型。本教程适合想要学习和应用Transformer模型的自然语言处理爱好者和开发者,可以帮助他们掌握Transformer模型的基本知识和技巧,以及如何利用Transformer模型进行文本分类和情感分析等任务。 使用Transformer模型进行文本分类和情感分析的教程,介绍了Transformer模型的基本原理、结构和实现方法,以及如何使用Hugging Face的Transformers库和PyTorch框架来构建、训练和评估文本分类模型。本教程适合想要学习和应用Transformer模型的自然语言处理爱好者和开发者,可以帮助他们掌握Transformer模型的基本知识和技巧,以及如何利用Transformer模型进行文本分类和情感分析等任务。使用Tr
2024-03-11 15:36:15 636B pytorch pytorch 自然语言处理 transformer
1
NLP-study 记录做过的NLP任务,包含但不限于文本分类,关系分类,命名实体识别,文本摘要,文本生成等,基于tensorflow2.0或者pytorch框架。
2024-01-12 21:57:28 83.48MB Python
1
给大家分享一套课程——自然语言处理NLP企业级项目课程合集课程(实体关系抽取+情感分析+新闻文本分类+火车票识别+命名实体识别),大家下载学习。
2024-01-02 17:35:20 299B 自然语言处理 课程资源
1
支持向量机vc++实现.一个很好的分类系统 .可以分类文本
2023-10-15 08:05:51 1.53MB svm 文本分类
1
分享自然语言处理课程——自然语言处理NLP企业级项目课程合集(实体关系抽取+情感分析+新闻文本分类+火车票识别+命名实体识别),视频,源码,数据,课件,资料完整
2023-07-21 10:33:18 287B 自然语言处理 NLP
1
是一个情感分类的项目,前面是对emotion数据集的处理和分析,以及将整个数据集分词以及处理成模型的输入形式。 主要是通过加载一个文本分类的预训练模型,然后在数据集上面进emotion数据集上面的fine-tuning。然后对训练好的模型进行效果的分析,包括F1,Precision和Recall等。 fine-tune transformers distilbert-base-uncased - distilbert 是对 bert 的 distill 而来 - 模型结构更为简单, - bert-base-uncased 参数量:109482240 - distilbert-base-uncased 参数量:66362880 - trainer默认自动开启 torch 的多gpu模式, - `per_device_train_batch_size`: 这里是设置每个gpu上的样本数量, - 一般来说,多gpu模式希望多个gpu的性能尽量接近,否则最终多gpu的速度由最慢的gpu决定, - 比如快gpu 跑一个batch需要5秒。
2023-07-10 16:26:26 658KB bert Transformer fine-tuning LLM
1
自然语言处理作业:基于CNN的文本分类模型训练 数据划分 分成训练集、验证集、测试集 加载预训练词向量模型 基于CNN的文本分类 数据划分 分成训练集、验证集、测试集加载预训练词向量模型 ../资料/实验/第四章/sgns.sogou.word.bz2 使用Keras对语料进行处理 提取文本中的词并向量化处理,也可以使用其他工具,或自己编写 定义词嵌入矩阵生成Embedding Layer构建模型、训练、评估 输出模型的准确率(以图的形式)
2023-06-08 20:56:11 338.98MB 自然语言处理 cnn
1