文章《sakila数仓实战案例》配套资料
2021-11-09 17:14:37 1.46MB 数据仓库 kettle
1
大数据分层规范及表,字段规范,及数据处理方式,给予有需要的同学大数据分层规范及表,字段规范,及数据处理方式,给予有需要的同学大数据分层规范及表,字段规范,及数据处理方式,给予有需要的同学
2021-11-03 15:05:30 743KB 数据仓库规范设计文档
1
数仓3.0的文档资源
2021-10-25 18:06:00 26.13MB 数据仓库
1
本文档整理数据仓库搭建过程中的分层结构和数据库、表名、字段命名规范,对数仓开发、大数据开发有重要帮助,欢迎下载。有问题随时博客留言或者私信我。
2021-10-22 15:10:14 38KB 大数据 数据仓库 规范文档
1
Tableau带来实时数仓产品全新的洞察能力 云栖大会
2021-10-21 09:06:34 38.39MB Tableau 数据仓库 云栖大会 数据可视化
1
手把手视频详细讲解项目开发全过程,需要的小伙伴自行百度网盘下载,链接见附件,永久有效。 课程简介 通过知识点讲解、案例实战、理论概念讲解来学习基于AWS云平台实现云上数仓的构建和开发。 课程亮点 1,全程基于AWS云平台 2,对AWS相关技术进行深入学习 3,实操配合案例,更容易理解 4,包含BI开发的内容 适用人群 1、对大数据技术感兴趣的在校生及应届毕业生。 2、大数据从业者,希望进一步提升个人技能,拓展职业路线。 3、对大数据行业感兴趣的相关人员。 4、对AWS云平台感兴趣的相关人员。 课程内容 一、云平台的基础概念 二、AWS 常见服务简介 三、课程前期准备 四、AWS RDS - 快速入门 五、ETL工具- AWS Glue 六、云上Hadoop - AWS EMR 七、云上数仓Redshift - QuickStart 八、云上数仓Redshift - 数据库开发指南 九、数仓理论简介 十、基于AWS云服务的数仓业务开发 十一、BI - SuperSet 十二、AWS BI - QuickSight
2021-10-18 20:10:42 75B AWS hadoop Redshift 数据仓库
推荐,最强大数据学习与最佳实践资料合集,基础+架构+治理+案例,共100份。 一、基础篇 快手EB级HDFS挑战与实践 Hive任务开发规范 一文看懂Hadoop生态圈 资料-CentOS7搭建Hadoop-2.7.7集群 ClickHouse官方中文文档 ETL流程、数据流图及ETL过程解决方案 Google-MapReduce中文版_1.0 Hadoop安装及分布式部署 Hadoop精选面试题和MapReduce编程企业级编程实践 HDFS-part2-原理详解 HDFS核心内容及命令-2020 hive安装 hive语法和常用函数 Kafka安装 kylin安装 mapreduce调优指南 sqoop安装 二、架构篇 Flink-1.11 Hive集成与批流一体 ClickHouse在苏宁用户画像场景的实践 优酷大数据 OLAP 技术选型 阿里数据湖选型 各种系统架构图与详细说明 关于BI工具选型的参考依据 Apache Doris在京东搜索实时OLAP中的应用 ClickHouse官方中文文档 ClickHouse原理解析与应用实践 Doris竞品对比 Doris在美团外卖数仓架构中业务实践与改进思路 DorisDB原理剖析 和应用实践篇2021 Flink 流批一体的技术架构以及在阿里的实践 Flink实时仓库实践 Hadoop开源相关,Flink,Kylin等集群搭建2021 KylinCloud+Hudi实践 三、数仓篇 传统数仓与大数据数仓区别 模板-事实表梳理 模板-维度梳理 模板-业务梳理 模板-指标体系梳理 模板1-数据仓库项目计划 模板2-命名规范 模板3_访谈提问和沟通记录单模板 模板4_公共数据资源管理调研模板 模板5_公共数据资源管理分析模板 模板6-报表需求梳理 内部分享-基于 Hudi 和 Kylin 构建准实时高性能数据仓库 商业银行数据仓库系统V2.0 数据仓库建设方案 数据仓库建设规范模板 数据仓库整体设计方案模板 Hadoop构建数据仓库实践 四、治理篇 快手从模型规范开始的数据治理实践 第12章元数据管理-DAMA-DMBOK:数据管理知识体系 权限管理设计方案 数据安全模板-访问权限梳理表 数据治理服务解决方案 数据治理及数据资产化创新实践-京东 万振龙:数据治理与大数据平台设计 主数据管理实践白皮书(1.0版) Apache atlas使用说明文档 atlas安装 CDH启用kerberos身份认证和sentry权限管理 DAMA-部委级数据治理项目经验分享 GrowingIO 2020指标体系与数据采集 GrowingIO公开课:搭建业务+数据一体化的指标体系 IBM 数据治理统一流程 ISO38500 IT治理国际标准 ISO_IEC_38500_2008_version_PDF 五、案例篇 字节Apache Flink在字节跳动的实践 Hudi on Flink在顺丰的实践应用-蔡适择 滴滴Flink在滴滴出行的应用与实践 阿里基于Flink的实时计算平台 菜鸟在物流场景中基于Apache Flink的流计算实践 腾讯clickhouse实践 Clickhouse玩转每天千亿数据-趣头条 微博基于Flink的机器学习实践 快手稳定性体系建设 快手元数据平台化建设及应用场景 快手指标规范化及OneService平台化实战 Apache Flink 在美团的实践与应用 快手服务治理平台+KESS+的设计理念和实战 快手数据中台建设:大数据服务化之路 快手离线数据全链路分级保障平台化建设 快手万亿级实时 OLAP 平台的建设与实践 ClickHouse在快手的大规模应用与架构改进 美团点评酒旅数据仓库建设实践 美团酒旅数据治理实践 美团外卖为何使用Doris创建数据仓库 内部分享-基于 Hudi 和 Kylin 构建准实时高性能数据仓库 实时数据产品实践——美团大交通战场沙盘 ClickHouse在苏宁用户画像场景的实践 腾讯云clickhouse性能调优实践 融合趋势下基于 Flink Kylin Hudi 湖仓一体的大数据生态体系 ClickHouse 在头条的技术演进 Doris的用户画像人群应用-会议组 Doris在美团外卖数仓架构中业务实践与改进思路 Flink 在 OPPO 的平台研发与应用实践 Flink实时仓库实践 Flink在滴滴的应用实践
手把手视频详细讲解项目开发全过程,需要的小伙伴自行百度网盘下载,链接见附件,永久有效。 课程介绍 智数电商主要是对来自全品类B2B2C电商系统的数据进行分析,数据仓库分为离线数仓和实时数仓,技术框架依托于大数据CDH发型版构建。智数电商在业务上贴近企业实际需求,指标计算完成后采用开源BI工具Apache superset对指标数据进行完美的可视化展示。 课程亮点 1,理论+实践,让你既能学懂也能学会 2,图文并茂,化繁为简,让知识通俗易懂,不再抽象 3,案例契合实际开发,让学生学有所用,基于垂直电商平台构建的用户全方位画像,完整抽取出一个用户的信息全貌 课程内容 第一章:KettleETL平台 第二章:数据仓库建模以及订单主题分析(1天) 第三章:用户订单行为指标开发与点击流主题分析(1天) 第四章:点击流主题分析(1天) 第五章:Kylin快速数据分析(1天) 第六章:Kylin性能调优及数据可视化平台(1天) 第七章:Canal实时数据采集(1天) 第八章:Flink实时ETL开发(1天) 第九章:Phoenix与Druid(1天) 第十章:使用Druid进行OLAP分析(1天) 第十一章:使用FlinkCEP进行订单风控分析(1天)
2021-10-14 18:05:40 75B flink kylin canal 大数据
阿里云:企业大数据平台数仓架构建设思路
2021-10-14 18:05:34 1.65MB 企业大数据平台 数仓架构建设
《Flink1.8实时数仓项目实战》课程主要基于Flink**稳定版本进行讲解,课程包含Flink DataSet、容错、Connector、Flink SQL以及实时数仓项目。希望通过本课程的学习,大家能快速学习Flink 批处理和Flink SQL,并通过实时数仓项目快速积累项目经验。
2021-10-13 18:08:03 474B flink 数据仓库
1