上传者: 42100971
|
上传时间: 2021-11-30 19:03:42
|
文件大小: 8KB
|
文件类型: -
textclassify
利用bow(词袋特征)、tfidf、word2vec进行中文文本分类
下图为部分数据集
第一列为分类标签,第二列为文本数据,是关于七类文学作品的简介
requirements
gensim
sklearn
bow
accuracy=0.918533,precision=0.918528,recall=0.918533,f1=0.918515
tfidf
accuracy = 0.931081, precision = 0.931091, recall = 0.931081, f1 = 0.931071
word2vec
accuracy = 0.573359, precision = 0.565731, recall = 0.573359, f1 = 0.567236