chinese_text_classification
通过一个中文文本分类问题系统实现了各种分类方法
数据来源
数据搜狗新闻
类别
有汽车,娱乐,军事,体育,技术五种类别。原始数据比较大,没有上传,分词,去除重组词之后的数据放在processed_data文件夹下。
分类算法
主要实现了以下分类算法:
NB(朴素贝叶斯)
支持向量机
快速文本
text_CNN
text_RNN
text_RCNN
text_Bi_LSTM
text_Attention_Bi_LSTM
HAN(分层注意网络)
埃尔莫
分类准确率
分类准确率都在90%附近,没有进行过多预处理,只为熟悉算法的使用。
依赖库
基于tensorflow2.0实现,可以在win和linux下运行。觉得有用的点个赞,谢谢。
2022-03-02 22:16:24
6.73MB
系统开源
1