常规相似度测量方法的性能受到高维数据维数诅咒的严重影响,原因是稀疏维数和噪声维数之间的数据差异占据了很大一部分相似度,从而导致任何结果之间的差异。提出了一种基于归一化净格子空间的高维数据测量方法,将每个维的数据范围划分为几个区间,将不同维的分量映射到对应的区间上,只有相同或相邻区间的分量为了验证该方法,为验证该方法,使用了三种数据类型,并比较了七种常见的相似性测量方法。 实验结果表明,该方法的相对差异随维数的增加而增加,比常规方法高出约两个或三个数量级。此外,该方法在不同维度上的相似范围为[0,1 ],适合进行降维后的相似性分析。
1