Javascript中数据流的异常值检测
这是用于预测数据集中异常值的多元正态分布模型的实现。 有两种数据要么是异常值,要么是正常数据。 假设正态数据已生成高斯分布。 我们选择一个阈值是指截断尾部形状。 该算法是对称的,因此它可以考虑异常值的两个极端(高和低)。 阈值的值可以通过训练对测试数据集执行交叉验证来估计。
这个库是使用 syvester.js 库构建的。 包中的 html 文件显示了它在实践中的使用方式。
但是,index1.html 示例中的演示适用于 3 维数据。 这可以通过修改 outlier.js 中的 mergeArrays 方法来更新。 这是因为我们正在附加批量数据,并且几行代码调整将使其适用于任意数量的维度。
该算法遵循从不混合训练集和测试集的原则。 我们需要设置分类器来开始这个过程。 该数据不作为训练集,下一批数据将被馈送到分类器。
在训练集上获得协方差矩
1