数据挖掘中的离群点检测算法研究.pdf
2022-07-11 19:13:03 3.26MB 文档资料
 基于密度的局部离群点检测算法(LOF)的时间复杂度较高且不适用于大规模数据集和高维数据集的离群点检测
2022-04-18 10:58:21 1.03MB 离群点检测
1
提供了离群点检测的matlab程序,包含了距离尺度因子,编程思路简单易懂,适合初学者看懂程序,方便修改,程序正确无误,可下载使用。
2021-12-22 22:34:15 932B 离群点检测 距离尺度因子
1
针对基于聚类的离群点检测算法在处理高维数据流时效率和精确度低的问题,提出一种高维数据流的聚类离群点检测(CODHD-Stream)算法.该算法首先采用滑动窗口技术对数据流划分,然后通过属性约简算法对高维数据集降维;其次运用基于距离的信息熵过滤机制的K-means聚类算法将数据集划分成微聚类,并检测微聚类的离群点.通过实验结果分析表明:该算法可以有效提高高维数据流中离群点检测的效率和准确度.
1
异常值检测对于构建高度预测​​模型至关重要。 在这项研究中,我们通过建立基于确定正常样本的交叉预测模型并单独分析可疑样本的预测误差分布,提出了一种增强的蒙特卡罗异常值检测(EMCOD)方法。
2021-11-15 22:09:00 73KB matlab
1
matlabk基于近邻的离群点检测代码莫夫 一种新的基于子结构的局部异常检测算法 摘要:已经提出了许多局部异常值检测技术来识别有意义的局部异常值,宝贵的研究通常使用 k-最近邻来量化局部邻域(kNN 邻域)并设计异常值评分函数。 然而,kNN 邻域不能准确表达呈现非球面分布的数据集的局部特征。 此外,评分函数基于一个潜在的假设,即观察的所有参考邻居都是正常的,这通常会导致低检测性能。 此外,基于 kNN 的方法通常对 k 敏感。 为了解决这些问题,提出了局部邻域和离群点评分函数的新定义,分别命名为k个节点的最小旋转树(k-MST)和基于k-MST的离群点因子(kMOF)。 k-MST对数据没有特殊要求,对k不敏感,接近的数据点可以共享同一个k-MST。 与传统的评分函数不同,kMOF 对每个子结构而不是数据集的每个数据点进行评分。 基于这些新设计,所提出的算法对于检测异常值和异常值组非常有效,并且具有提高效率的潜力。 在合成数据集和真实数据集上的实验结果表明,所提出的算法是有效且稳健的。 %%%%%%%%%%%%%%%%%%%%%%% MATLAB 2013a 及更高版本支持此代码。
2021-11-10 20:26:51 135KB 系统开源
1
异常检测必读图书,全面介绍异常检测常用方法,包括统计学方法,机器学习方法等等
2021-11-02 11:54:51 5.38MB Anoma 异常检测 离群点检测
1
空气质量指数(Air Quality Index, AQI)预测可以为人们日常生产活动以及空气污染治理工作提供指导. 针对空气质量指数预测模型受离群点影响较大的问题, 利用孤立森林算法对空气质量数据集进行离群点分析, 采用离群鲁棒极限学习机模型(ORELM)对空气质量指数进行预测, 并构建误差修正模块对模型预测误差进行修正. 最后, 以北京市空气质量数据作为研究对象, 分别利用ORELM模型以及极限学习机(ELM)模型进行预测, 并对ORELM模型预测结果进行误差修正. 实验结果表明: 离群鲁棒极限学习机对离群点数据集泛化性能更强, 误差修正模块能有效提高模型的预测精度.
1
图 18.12 全局离群点检测气泡图 “Local Outlier Factor”基于本地的离群点检测操作符,操作流程如图 18.13,检测结果如图 18.13 图 18.13 离群点检测操作流程
2021-08-26 09:48:14 6.46MB RapidMiner
1
基于离群点检测的不确定数据流聚类算法研究.pdf
2021-08-19 09:21:18 3.56MB 聚类 算法 数据结构 参考文献