AnomalyFilter
本项目应用孤立森林异常检测算法,过滤JMeter 在对Splunk 数据库进行压力测试过程中产生的异常性能数据。
背景
在压力测试和性能分析过程中,通常有两种情形会导致测试结果不准确:
一是由于JMeter 和LoadRunner 等工具在启动多线程是有一个爬坡过程,通常需要1-10秒钟左右,这个时间也不会很长。但在这个过程由于线程数量不定,导致了测试数据的可靠性降低。
二是由于现实测试中通常会存在网络异常的情形,极少量的异常值会大大影响对被测对象的性能评估。
在上述场景中,异常的数据与整个测试数据样本相比是很少的一部分,常见的分类算法例如:SVM、逻辑回归等都不合适。而孤立森林算法恰好非常适合上述场景,首先测试数据具备一定的连续性,其次异常数据具备显着的离群特征,最后异常数据的产生是小概率事件,因此,孤立森林算法在网络安全、交易欺诈、疾病监测等方面也有着广泛的
2022-01-15 14:53:42
390KB
Python
1