从微博中准确而高效地挖掘出突发事件是近年来的研究热点。通过词频统计、词增长率计算和 TF - PDF 算法抽取突发词集,使用突发词表示文本并结合微博突发事件的描述特征进行文本过滤; 提出一种“绝对聚类”算 法,对描述突发事件的文本进行聚类,并通过微博的回复数和转发数加权计算热度,检测各类事件中热度最大的 作为突发事件。检测准确率为 92. 60% ,召回率为 85. 51% ,F 值为 0. 89。实验结果表明,相比于传统的突发事件 检测方法,该方法能够比较准确地检测到微博中的突发事件,有一定的应用价值。
2021-07-28 16:46:44 499KB 突发事件 文本过滤 绝对聚类 突发词
1