布隆过滤器,大家学过数据结构的应该都清楚,一般的字典树要实现嵌入和查找都内存的消耗非常大,布隆过滤器有BloomFilter<1000000,string, BKDRHash, APHash, DJBHash> bf五个参数你要查找的元素个数,查找元素类型,三个Hash函数, m = -n*ln(p) / (ln(2)^2) k = m/n * ln(2) # k 为哈希函数个数 # m 为布隆过滤器长度 # n 为插入的元素个数 # p 为可接受该容器的误报率(0-1) 当k等于3时,m=4.36n,于是可以设置m/n=5,k如果多的话,m/n可以设置更大来追求准确率,一般m/n设置为k*ln(2)就行,此时误差率小于0.01
2022-09-04 14:05:42 9.14MB 布隆过滤器 数据结构 c++ 内存优化
1
布隆过滤器( BloomFilter )是一种数据结构,比较巧妙的概率型数据结构(probabilistic data structure),特点是高效地插入和查询,可以用来告诉你 “某样东西一定不存在或者可能存在”。这篇文章主要介绍了python实现布隆过滤器 ,需要的朋友可以参考下
2022-05-21 10:44:13 384KB python布隆过滤器 布隆过滤器实现
1