注意这不是官方支持的Google产品。
布谷鸟指数
概述
( ,CI)是一种轻量级的二级索引结构,它以节省空间的方式表示键和列分区之间的多对多关系。 CI的核心是将大小可变的指纹与指示合格分区的压缩位图相关联。
它解决什么问题?
传统上,通过为每个分区维护一个过滤器(例如Bloom过滤器)来索引该分区中包含的所有唯一键值,来查找可能包含给定查找关键字的所有分区的问题得以解决:
Partition 0:
A, B => Bloom filter 0
Partition 1:
B, C => Bloom filter 1
...
要识别包含密钥的所有分区,我们需要探查所有每个分区的过滤器(可能很多)。 由于布隆过滤器可能会返回假阳性,因此我们有可能(例如1%)意外地将阴性分区识别为阳性。 在上面的示例中,对键A的查找可能返回分区0(真肯定)和1(假肯定)。 根据存储介质的不同,错误的肯定
1