上传者: 38538224
|
上传时间: 2021-12-08 14:12:27
|
文件大小: 54KB
|
文件类型: -
同步更新于知乎:https://zhuanlan.zhihu.com/p/107889958
最近在做整理,偶尔看到公众号的一篇关于随机抽样的分享,这个算法面试中经常会问到,特此总结一下。
网上关于这块解释并不清晰,主要参考如下,个人感觉写的比他更通俗易懂,哈哈。
https://zhuanlan.zhihu.com/p/107793995
解决什么问题
主要用于解决大数据流中的随机抽样问题,即:当内存有限,数据长度很大,甚至未知,那么如何从中随机选取k个数据,并且要求是等概率
算法核心
水塘抽样的核心是,只遍历一次,每次都考虑一个问题:当前元素是否被选中,选中后替换之前选中的哪一个元素。
知