近年来,随着移动终端技术的不断发展,人们可以愈发便捷地通过微博、论坛等载体来
表达个人的情绪及观点。用户通过这些载体发布的信息中往往包含着一定程度的情感倾向、意见倾向特征,通过情感倾向分析技术挖掘这些特征对于舆情分析、舆情监控等有着十分重要的意义。本文以论坛文本数据为研究对象,使用基于机器学习的情感倾向分析方法进行了相关研究,具体研究内容如下:
首先,介绍了针对论坛数据进行舆论倾向性研究的背景及意义,阐述了业内使用机器学
习技术进行情感分析的相关研究现状。同时,针对情感倾向分析的流程和相关技术进行了介绍,包括文本采集技术、文本预处理技术、文本表示技术、性能评估指标等。
而后,研究使用朴素贝叶斯技术以及字典法针对论坛文本进行情感倾向性分析,经过算
法适用性比较,最终选择了效果更优的字典法。通过扩充分词库、扩充极性词库、构建面向突发事件的情感倾向词典等方式对算法进行了四次优化,最终平均准确率达到了87%,平均召回率达到了81%,能较好地反映文本针对突发事件的意见倾向数值。
关键词 : 机器学习,网络舆情,情感倾向分析,朴素贝叶斯,情感字典