针对传统词项之间语义关系抽取难以适用于微博,导致发现微博热点事件不敏感的问题,提出一种基于词项语义共现和社团划分的方法发现热点事件。首先利用热度定义对微博数据进行初次筛选,通过构建共现词项图来模拟词项间的语义相关性,并结合修改的TF-IDF公式计算词项间的语义相关度;借助社区划分和模块度的概念对词项图进行划分,完成词项聚类,进而获得热点事件。实验结果表明,与同类方法相比,该方法的准确率较高,发现的热点事件与实时事件基本保持一致,具有较好的热点识别效果。
2021-11-24 23:58:38 1.37MB 热度 亲密度 语义相关性
1