情感是人类智能表现的一种特征。情感既可以是身体上生理状态发生变化的反映,
也可通过文本加以表达。目前研究情感分析的语料资源大部分来源于用户评论文本。
评论文本已成为消费者购买商品的重要参考。从文本中获取情感信息,首先要从文本
中抽取语义特征信息并加以分类。因为无法及时提取到信息丰富的评论,且基于词典
的方法或基于机器学习的方法量化得到的情感特征过于片面,无法很好的辅助消费者
进行决策,所以提取评论文本的情感特征及对评论文本进行主客观分类的研究就有现
实意义。但基于词典的研究依赖于情感词典,由于新的词汇以及未登录词较多,情感
词典的构建难度较大,且词语缺少强度量化。机器学习的方法不能较好解决多个情感
词时引发的情感发散问题。本文提出了结合词典和机器学习的情感分析方法,得到可
以提高预测评论主客观性的正确率的情感特征组合。
本文将手机评论文本作为研究对象进行相关情感分析研究工作,将基于词典与
主题模型结合方法、基于机器学习方法以及词典和机器学习组合方法得到的情感特征
进行量化表示。实验比较量化的情感特征对主客观分类的影响。本文的研究工作如下:
(1)词典扩充与极性计算研究。在基于词典的情感