从微博中准确而高效地挖掘出突发事件是近年来的研究热点。通过词频统计、词增长率计算和 TF - PDF
算法抽取突发词集,使用突发词表示文本并结合微博突发事件的描述特征进行文本过滤; 提出一种“绝对聚类”算
法,对描述突发事件的文本进行聚类,并通过微博的回复数和转发数加权计算热度,检测各类事件中热度最大的
作为突发事件。检测准确率为 92. 60% ,召回率为 85. 51% ,F 值为 0. 89。实验结果表明,相比于传统的突发事件
检测方法,该方法能够比较准确地检测到微博中的突发事件,有一定的应用价值。
1