上传者: 42104906
|
上传时间: 2021-08-19 22:24:07
|
文件大小: 1.55MB
|
文件类型: ZIP
细粒度情感分类
此仓库显示了对各种NLP方法的比较和讨论,这些方法可以在(SST-5)数据集上执行5级情感分类。 目标是使用多个基于规则,基于线性和神经网络的分类器来预测此数据集上的类,并查看它们之间的区别。
当前已实现以下分类器:
TextBlob :基于规则,使用库中的内部polarity度量。
Vader :基于规则,使用库中的compound极性分数。
Logistic回归:在将词汇表转换为特征向量并考虑使用TF-IDF的词频影响后,在scikit-learn中训练简单的logistic回归模型。
SVM :在将词汇表转换为特征向量并使用TF-IDF考虑词频的影响后,在sci