布隆过滤器,大家学过数据结构的应该都清楚,一般的字典树要实现嵌入和查找都内存的消耗非常大,布隆过滤器有BloomFilter<1000000,string, BKDRHash, APHash, DJBHash> bf五个参数你要查找的元素个数,查找元素类型,三个Hash函数,
m = -n*ln(p) / (ln(2)^2)
k = m/n * ln(2)
# k 为哈希函数个数
# m 为布隆过滤器长度
# n 为插入的元素个数
# p 为可接受该容器的误报率(0-1)
当k等于3时,m=4.36n,于是可以设置m/n=5,k如果多的话,m/n可以设置更大来追求准确率,一般m/n设置为k*ln(2)就行,此时误差率小于0.01
1