全k近邻(all k-nearest neighbor,AkNN)查询,是k近邻查询的一个变型,旨在在一个查询过程中为给定数据集的每个对象确定k个最近邻。提出了一种在Hadoop分布式平台下处理高维大数据的AkNN查询算法。首先使用行条化思想结合p-stable LSH算法将高维数据对象降维,然后结合空间填充曲线Z-order的优良特性,把降维后的数据嵌入一维空间中,接着进行范围查询。整个过程使用MapReduce框架分布式并行处理。实验结果表明,所提出的算法可以高效处理高维大数据的AkNN查询。
1
LSHash, 一种局部敏感散列的快速 python LSHash版本:0.0.4dev一种基于持久支持的局部敏感散列快速 python 。高光numpy数组对大量高维数据的快速哈希计算。通过Redis支持持久性。支持多个哈希索引。内置支持输出输出的通用距离/目标函
2021-11-21 16:14:12 9KB 开源
1
LSH论文,改进的局部敏感哈希,可供参考
2021-06-08 19:11:27 840KB LSH 哈希
1