matlabk基于近邻的离群点检测代码莫夫
一种新的基于子结构的局部异常检测算法
摘要:已经提出了许多局部异常值检测技术来识别有意义的局部异常值,宝贵的研究通常使用
k-最近邻来量化局部邻域(kNN
邻域)并设计异常值评分函数。
然而,kNN
邻域不能准确表达呈现非球面分布的数据集的局部特征。
此外,评分函数基于一个潜在的假设,即观察的所有参考邻居都是正常的,这通常会导致低检测性能。
此外,基于
kNN
的方法通常对
k
敏感。
为了解决这些问题,提出了局部邻域和离群点评分函数的新定义,分别命名为k个节点的最小旋转树(k-MST)和基于k-MST的离群点因子(kMOF)。
k-MST对数据没有特殊要求,对k不敏感,接近的数据点可以共享同一个k-MST。
与传统的评分函数不同,kMOF
对每个子结构而不是数据集的每个数据点进行评分。
基于这些新设计,所提出的算法对于检测异常值和异常值组非常有效,并且具有提高效率的潜力。
在合成数据集和真实数据集上的实验结果表明,所提出的算法是有效且稳健的。
%%%%%%%%%%%%%%%%%%%%%%%
MATLAB
2013a
及更高版本支持此代码。
2021-11-10 20:26:51
135KB
系统开源
1