淘宝数据仓库架构实践: 1、元数据平台架构介绍 2、存储计算架构介绍 3、开发管理架构介绍 4、应用开放平台架构介绍
2021-04-20 12:51:26 2.85MB 淘宝 数据仓库
1
该资源包含了《大数据之路-阿里巴巴大数据》这本书的整体思维导图,并且按照自己从业经验进行归纳整理,囊括了:数据采集,数据计算,数据模型,数据管理,数据生命周期的相关知识点
1
Druid:为OLAP而生,多快好省高。 • 多,可以处理海量的数据, Druid官网说可以扩展到PB级,这个量非常大。 • 快,亚秒级响应,官网说10亿量级下做到亚秒响应,我们实际应用也是亚秒响应,实时导入,导入即可查询。导入了以后我们就可以查询到,这个还是非常非常的牛的。 • 好,就是高可用,分布式容错架构,可以做到无宕机。 • 省,采用列存储,高效压缩。我举一下我们的例子,我们原始日志是10亿量级,我们选取16个维度,22个度量值,每天生成的索引是几百兆。 • 高,它支持高并发,可以是作为面向用户的应用
2019-12-21 19:50:36 266KB Druid 实时 OLAP 数据仓库架构
1