离群检测在许多应用领域中显示出越来越高的实用价值,例如入侵检测,欺诈检测,电子商务中犯罪活动的发现等。 已经开发出许多用于离群值检测的技术,包括基于分布的离群值检测算法,基于深度的离群值检测算法,基于距离的离群值检测算法,基于密度的离群值检测算法和基于聚类的离群值检测。 频谱聚类作为近年来出现的竞争性聚类算法备受关注。 但是,它不能很好地扩展到现代大型数据集。 为了部分规避此缺点,在本文中,我们提出了一种受谱聚类启发的新的异常值检测方法。 我们的算法结合了kNN的概念和频谱聚类技术,通过在特征空间中统计地使用特征值和特征向量的信息,获得异常数据作为离群值。 我们将我们的方法与基于距离的离群值检测方法和基于密度的离群值检测方法的性能进行比较。 实验结果表明,我们的算法可以有效地识别异常值。
2023-03-06 11:01:42 225KB distance-based outlier detection density-based
1
经典的回归分析与离群探测英文原版书籍,目前这本书籍还很难找到电子版,而且很清楚哦
2022-01-04 21:32:58 13.95MB outlier detection
1
皮诺玛利 PyNomaly是LoOP(局部异常值)的Python 3实现。 LoOP是Kriegel,Kröger,Schubert和Zimek提出的基于局部密度的离群值检测方法,可提供[0,1]范围内的离群值,这些分数可直接解释为样本是离群值的概率。 每个样本的离群值称为本地离群值概率。 它测量给定样本相对于其邻居的密度的局部偏差作为局部离群值因子(LOF),但提供范围为[0,1]的归一化离群值。 这些离群值可直接解释为对象成为离群的概率。 由于本地异常值提供的评分范围为[0,1],因此从业人员可以根据应用程序自由解释结果。 像LOF一样,它是局部的,异常分数取决于样本相对于周围邻域的隔离程度。 局部性由k个最近的邻居给出,其距离用于估计局部密度。 通过将样本的局部密度与其邻域的局部密度进行比较,可以识别出与邻域相比密度较低的区域中的样本,从而根据其局部离群概率来识别离群的样本。
1
自己写的local outlier detection 的matlab 代码
2019-12-21 19:56:36 2KB lof outlier detection
1