迄今为止,关于犯罪预测的研究还很少。 在这项研究中,根据个人标签数据以及城市S中罪犯和普通百姓的旅行和住宿数据,将与城市S有关的犯罪数据分为1:1的训练数据集和验证数据集。首先,采用FP-增长算法来计算犯罪分子和普通民众在其旅行和旅馆住宿数据中的关联规则,以便根据关联规则发现犯罪嫌疑人。 其次,采用DBSCAN算法对罪犯和普通人的标签数据进行聚类,然后进行相似度计算,以基于标签聚类发现犯罪嫌疑人。 最后,对上述两组犯罪嫌疑人进行交叉路口操作,并根据犯罪验证集对产生的交叉路口进行验证,以消除出现在交叉路口的犯罪分子,从而获得最终的犯罪嫌疑人。 结果表明,根据FP增长算法计算的关联规则,检索到648名犯罪嫌疑人,而根据DBSCAN聚类和个人标签的余弦相似度,检索到973名犯罪嫌疑人。 两组相交后,犯罪嫌疑人的数量缩小到567名,使用验证集进一步验证了567名犯罪嫌疑人中的419名是罪犯,从而使其他148名成为最终犯罪嫌疑人并给出了预测准确性为73.9%。 本研究基于关联规则和标签聚类的犯罪嫌疑人数据挖掘方法已成功应用于城市S的警务系统,实验证明了该方法在侦查犯罪嫌疑人中的有效性。
1