布隆过滤器,大家学过数据结构的应该都清楚,一般的字典树要实现嵌入和查找都内存的消耗非常大,布隆过滤器有BloomFilter<1000000,string, BKDRHash, APHash, DJBHash> bf五个参数你要查找的元素个数,查找元素类型,三个Hash函数, m = -n*ln(p) / (ln(2)^2) k = m/n * ln(2) # k 为哈希函数个数 # m 为布隆过滤器长度 # n 为插入的元素个数 # p 为可接受该容器的误报率(0-1) 当k等于3时,m=4.36n,于是可以设置m/n=5,k如果多的话,m/n可以设置更大来追求准确率,一般m/n设置为k*ln(2)就行,此时误差率小于0.01
2022-09-04 14:05:42 9.14MB 布隆过滤器 数据结构 c++ 内存优化
1
在学习redis过程中提到一个缓存击穿的问题, 书中参考的解决方案之一是使用布隆过滤器, 那么就有必要来了解一下什么是布隆过滤器。在参考了许多博客之后, 写个总结记录一下。 一、布隆过滤器简介 什么是布隆过滤器? 本质上布隆过滤器( BloomFilter )是一种数据结构,比较巧妙的概率型数据结构(probabilistic data structure),特点是高效地插入和查询,可以用来告诉你 “某样东西一定不存在或者可能存在”。 相比于传统的 Set、Map 等数据结构,它更高效、占用空间更少,但是缺点是其返回的结果是概率性的,而不是确切的。 布隆过滤器原理 布隆过滤器内部维护一个bit
2022-05-28 14:52:15 385KB hash hash函数 python
1
布隆过滤器( BloomFilter )是一种数据结构,比较巧妙的概率型数据结构(probabilistic data structure),特点是高效地插入和查询,可以用来告诉你 “某样东西一定不存在或者可能存在”。这篇文章主要介绍了python实现布隆过滤器 ,需要的朋友可以参考下
2022-05-21 10:44:13 384KB python布隆过滤器 布隆过滤器实现
1
介绍Bloom Filter(布隆过滤器)原理、实现及具体应用,包含9个不同PPT及PDF文档资料,对Bloom Filter感兴趣、想学习的同学可以下载查看下
2022-04-26 23:53:30 9.1MB 存储 bloom filter 布隆过滤器
1
项目作者:fuyinglong 邮箱: CSDN 昵称:你喜欢梅西吗 github 主页: 项目名:chat-project-based-on-ubuntu 介绍 使用 C++实现的 ubuntu 环境下的聊天小项目,采用 C/S 架构,支持注册、登录、记录登录状态、私聊、群聊功能,前期使用多线程实现并发服务器,后期利用 epoll 监听+线程池处理的 Reactor 模式实现并发服务器,进行了压力测试,并采用 bitmap 实现的布隆过滤器减少对 MySQL 的查询。 项目中使用 TCP 网络编程实现 C/S 的信息交互,使用 Mysql 记录用户账号、密码,使用 redis 记录用户的登录状态,编写了 makefile 进行编译,使用 shell 脚本提高了开发效率,开发过程使用 git 进行版本管理,编写了说明文档。 主要功能: 1、用户注册,数据存储到服务器主机的数据库中 2、用户
2022-04-07 19:16:13 8.78MB C++
1
文章:http://blog.sina.com.cn/s/blog_5f49acab0102x7i5.html 在日常生活中,包括在设计计算机软件时,我们经常要判断一个元素是否在一个 集合中。比如在字处理软件中,需要检查一个英语单词是否拼写正确(也就是要判断它是否在已知的字典中);在 FBI,一个嫌疑人的名字是否已经在嫌疑名单上;在网络爬虫里,一个网址是否被访问过等等。最直接的方法就是将集合中全部的元素存在计算机中,遇到一个新 元素时,将它和集合中的元素直接比较即可。一般来讲,计算机中的集合是用哈希表(hash table)来存储的。它的好处是快速准确,缺点是费存储空间。当集合比较小时,这个问题不显著,但是当集合巨大时,哈希表存储效率低的问题就显现出来 了。比如说,一个象 Yahoo,Hotmail 和 Gmai 那样的公众电子邮件(email)提供商,总是需要过滤来自发送垃圾邮件的人(spamer)的垃圾邮件。一个办法就是记录下那些发垃圾邮件的 email 地址。由于那些发送者不停地在注册新的地址,全世界少说也有几十亿个发垃圾邮件的地址,将他们都存起来则需要大量的网络服务器。如果用哈希表,每存储一亿 个 email 地址
2022-03-04 14:39:39 2KB 布隆过滤器
1
Java 实现的高性能布隆过滤器!.zip,Advanced Bloom Filter Based Algorithms for Efficient Approximate Data De-Duplication in Streams
2022-02-18 17:51:38 93KB 开源项目
1
鉴于github网络不稳定,此处提供免费下载,供广大学习爱好者使用。
2021-11-29 09:09:37 111KB Redis RedisBloom 布隆过滤器
1
布隆过滤器插件
2021-10-21 21:05:27 1KB redis
1