异常检测必读图书,全面介绍异常检测常用方法,包括统计学方法,机器学习方法等等
2021-11-02 11:54:51 5.38MB Anoma 异常检测 离群点检测
1
为适应数据集分布形状多样性以及克服数据集密度问题,针对已有算法对离群簇检测效果欠佳的现状,提出了一种基于K-近邻树的离群检测算法KNMOD(outlier detection based on K-nearest neighborhood MST)。算法结合密度与方向因素,提出一种基于K-近邻的不相似性度量,然后带约束切割基于此度量构建的最小生成树从而获得离群点。算法可以有效地检测出局部离群点以及局部离群簇,与LOF、COF、KNN及INFLO算法的对比结果也证实了算法的优越性能。
1
空气质量指数(Air Quality Index, AQI)预测可以为人们日常生产活动以及空气污染治理工作提供指导. 针对空气质量指数预测模型受离群点影响较大的问题, 利用孤立森林算法对空气质量数据集进行离群点分析, 采用离群鲁棒极限学习机模型(ORELM)对空气质量指数进行预测, 并构建误差修正模块对模型预测误差进行修正. 最后, 以北京市空气质量数据作为研究对象, 分别利用ORELM模型以及极限学习机(ELM)模型进行预测, 并对ORELM模型预测结果进行误差修正. 实验结果表明: 离群鲁棒极限学习机对离群点数据集泛化性能更强, 误差修正模块能有效提高模型的预测精度.
1
异常检测、离群分析中文资料,包括了入门的知识,以及基本的算法模型,outlier ensembles 的概述性内容,是学习离群分析和异常检测的上好资料
2021-10-12 17:03:38 5.87MB 离群分析 异常检测 outlieranalysis
1
基于角度的离群值检测 在R中基于角度的离群因子的实现。有三种方法可用,一种是使用所有具有三次复杂度的数据的完整但缓慢的实现,一种是完全高效的完全随机化的方法,另一种是使用k最近邻方法。 这些算法特别适合于高维数据离群值检测。 安装 该软件包可在CRAN上获得: install.packages( " abodOutlier " ) library( abodOutlier ) 用法 abod( faithful , method = " randomized " , n_sample_size = 30 ) abod( faithful , method = " knn " , k = 20 ) 麻省理工学院许可。
2021-10-09 16:10:57 6KB R
1
幽门 Python局部异常因子算法的Python实现。 例子 例子1 以下示例说明了基于instances变量计算几个实例(例如[0,0],[5,5],[10,10] and [-8,-8] )的LOF值的简单用例。传递给LOF构造函数。 instances = [ (-4.8447532242074978, -5.6869538132901658), (1.7265577109364076, -2.5446963280374302), (-1.9885982441038819, 1.705719643962865), (-1.999050026772494, -4.0367551415711844), (-2.0550860126898964, -3.6247409893236426), (-1.4456945632547327, -3.7669258809535102
2021-09-01 21:57:05 44KB 附件源码 文章源码
1
图 18.12 全局离群点检测气泡图 “Local Outlier Factor”基于本地的离群点检测操作符,操作流程如图 18.13,检测结果如图 18.13 图 18.13 离群点检测操作流程
2021-08-26 09:48:14 6.46MB RapidMiner
1
基于离群点检测的不确定数据流聚类算法研究.pdf
2021-08-19 09:21:18 3.56MB 聚类 算法 数据结构 参考文献
行业分类-物理装置-一种基于子空间的离群点检测算法.zip
小结 本章主要根据数据挖掘的应用分类,重点介绍了对应的数据挖掘建模方 法及实现过程。通过对本章的学习,可在以后的数据挖掘过程中采用适 当的算法并按所陈述的步骤实现综合应用,更希望本章能给读者一些启 发,思考如何改进或创造更好的挖掘算法。 归纳起来,数据挖掘技术的基本任务主要体现在分类与预测、聚类、关 联规则、时序模式、离群点检测五个方面。 5.1分类与回归主要介绍了决策树和人工神经网络两个分类模型、回归分 析预测模型及其实现过程; 5.2聚类分析主要介绍了K-Means聚类算法,建立分类方法按照接近程度 对观测对象给出合理的分类并解释类与类之间的区别; 小结 5.3关联规则主要介绍了Apriori算法,以在一个数据集中找出各项之间的 关系; 5.4时序模式从序列的平稳性和非平稳型出发,对平稳时间序列主要介绍 了ARMA模型,对差分平稳序列建立了ARIMA模型,应用这两个模型对 相应的时间序列进行研究,找寻变化发展的规律,预测将来的走势; 5.5离群点检测主要介绍了基于模型和离群点的检测方法,是发现与大部 分其他对象显著不同的对象。 前5章是数据挖掘必备的原理知识,并为本书后面章节的案例理解和实验 操作奠定了理论基础。