上百节课视频详细讲解,需要的小伙伴自行百度网盘下载,链接见附件,永久有效。
本课程采用由浅入深,层层递进的讲解方式, 让你轻松掌握企业级数仓架构的搭建及使用, 使用该架构可以胜任企业级实时数仓和离线数仓构建。
课程内容:
1. 项目背景介绍
2. 数据建模应用
3. 基于Kylin的OLAP分析
4. 需求分析与项目设计
5. 订单与销售额指标计算
6.行为指标计算
7.Druid的安装和使用
8.流式数仓实现
适用人群:
1、对企业级数据仓库构建感兴趣,有一定大数据基础。
2、对目前职业有进一步提升要求,希望从事数据行业高薪工作的在职人员。
3、对数据行业感兴趣的相关人员。
基础课程主讲内容包括:
阶段一:千亿级实时数仓项目总体介绍
1. 数据仓库在企业里面的重要性
2. 千亿级实时数仓的项目演示
阶段二: 数据建模的应用
1. 为什么要数据建模
2. 维度和指标的概念
3. 指标和维度建模案例
阶段三. 数据仓库从0到1的过程
1. 数仓典型分层思想(ODS、DWB、DWS、DM、ADS)
2. 数仓建设0到1的过程实战
3. 企业级数据仓库设计的规范
阶段四:基于Kylin的OLAP分析
1. Kylin自带的example案例介绍
2. Kylin的Cube创建
3. Kylin的数据膨胀介绍
阶段五:需求分析与项目设计
1. 需求分析
2. canal搭建
3. canal数据写入kafka
阶段六:订单与销售额指标计算
1. 销售额指标体系介绍
2. flink实时消费Kafka订单数主题数据
3. 订单金额指标统计
阶段七:行为指标计算
1. 模拟通过埋点方式采集行为数据
2. 使用Flink Streaming计算用户行为相关指标
3. Flink CEP实现转化率分析
阶段八: Druid的安装和使用
1. Druid实时数据摄入
2. Druid基于JSON查询语法
3. Imply Pivot可视化数据分析