Spark-LSH 局部敏感哈希。 主要是的 PySpark 端口。 先决条件 火花 1.2+ Python 2.7+ SciPy 0.15+ NumPy 1.9+ 实施细则 该项目遵循 spark-hash Scala LSH 实现的主要工作流程。 它的核心lsh.py模块接受 RDD 支持的密集 NumPy 数组或 PySpark SparseVectors 列表,并生成一个模型,该模型只是对生成的所有中间 RDD 的包装。 下面将详细介绍每个步骤。 重要的是要注意,虽然这个管道将接受密集或稀疏向量,但来自的原始哈希函数几乎肯定会因密集向量而失败,导致所有向量都被散列到所有波段中。 目前正在开展工作以实现更均匀地分割密集向量的替代哈希函数。 对于稀疏情况,结果与的结果重复。 用法 用法遵循 spark-hash 项目的用法。 参数保持不变。 参数 命令行参数: --bins
2022-12-20 21:18:09 6KB Python
1
局部敏感哈希算法研究.doc
2022-05-12 09:10:50 940KB 文档资料 哈希算法 算法
针对现有的细节点柱形编码方法存在柱形编码有效性较差、检索错误率较高的问题,提出了一种改进的细节点柱形编码算法。该算法通过对原有的细节点柱形编码参数进行自适应选取,提高了柱形编码的有效性,有效地降低了指纹检索恢复时的错误率;同时引入局部敏感哈希方法,通过对柱形码进行检索与恢复找回有效的细节点对,提高了匹配的准确率。在FVC2002上的实验结果表明,改进算法具有较好的性能。
2022-04-14 16:00:16 1.27MB 柱形编码 自适应 局部敏感哈希
1
基于局部敏感哈希和结构化P2P网络的相似性图像检索的计算机研究.docx
2021-10-08 23:11:54 88KB C语言
locality-sensitive hashing(局部敏感哈希),实现高位数据搜索平台
2021-05-08 13:54:52 1KB lsh
1
Learning to Hash with its Application to Big Data Retrieval 是课程结课作业,简单的介绍了LSH(局部敏感哈希) 主要分以下几部分内容 1.Nearest Neighbor Search (Retrieval) 2.Two Stages of Hash Function Learning 3.Hash Fuction 4.LSH 5.Application 6.Evaluation
2021-05-08 13:38:59 442KB LSH hash
1
LSH (Locality-sensitive-hashing)局部敏感哈希算法 matlab实现
2021-04-13 22:41:31 34KB LSH局部敏感
1
Java实现simHash算法,对应博客http://www.cnblogs.com/hxsyl/p/4518506.html
2019-12-21 18:50:17 6KB simHash LSH 局部敏感哈希 网页去重
1