社交媒体为许多人提供了一个在线表达情感的机会。 对用户情绪进行自动分类可以帮助我们理解公众的偏爱,公众有很多有用的应用程序,包括情感检索和意见汇总。 短文本在Web上很普遍,尤其是在推文,问题和新闻标题中。 现有的大多数社会情感分类模型都集中在长文档传达的用户情感的检测上。 在本文中,我们介绍了一种用于对短文本进行用户情感分类的多标签最大熵(MME)模型。 MME通过对多个用户共同评分的多个情感标签和价进行建模,从而生成丰富的功能。 为了提高该方法在变尺度语料库上的鲁棒性,我们进一步开发了一种针对MME的协同训练算法,并将L-BFGS算法用于广义MME模型。 在现实世界中的短文本集合上进行的实验验证了这些方法对稀疏特征进行社会情感分类的有效性。 我们还演示了生成的词典在识别传达不同社会情感的实体和行为中的应用。 (C)2016 Elsevier BV保留所有权利。
1