网络文本情感分析方法主要分为两大途径,无监督情感分析方法和有监督情感分析方法[2]。在2002年PANG等学者首次采用电影评论数据建立了使用机器学习的有监督情感分类方法。他分别使用了支持向量机(SVM)、朴素贝叶斯(NB)、最大熵(ME)分类器,二情感分类特征主要采用情感词频[3]。实验表明基于机器学习的有监督分类结果准确率要高于基于传统的无监督方法。文献[4]也提出了一种结合SVM和NB分类器的新模型(NBSVM),这种新的模型在多个数据集都取得了很好的分类效果。有监督网络评论情感分类方法是基于标注训练集语料来进行评论分类的,而标注的语料具有领域依赖性,因此有监督网络评论情感分类效果的好坏与文本领域有直接的关系。在一个领域标注的训练集训练的分类器很可能在另一个领域分类效果并不好。所以,有监督情感分类方法需要在不同领域标注大量不同的训练集,才能取得比较好的分类效果。但是,在众多领域都标注大量训练集是一项十分困难的事情,需要消耗大量的人力物力,已经成为有监督情感分类的瓶颈。
1