textclassify
利用bow(词袋特征)、tfidf、word2vec进行中文文本分类
下图为部分数据集
第一列为分类标签,第二列为文本数据,是关于七类文学作品的简介
requirements
gensim
sklearn
bow
accuracy=0.918533,precision=0.918528,recall=0.918533,f1=0.918515
tfidf
accuracy = 0.931081, precision = 0.931091, recall = 0.931081, f1 = 0.931071
word2vec
accuracy = 0.573359, precision = 0.565731, recall = 0.573359, f1 = 0.567236
2021-11-30 19:03:42
8KB
Python
1