推荐,最强大数据学习与最佳实践资料合集,基础+架构+治理+案例,共100份。
一、基础篇
快手EB级HDFS挑战与实践
Hive任务开发规范
一文看懂Hadoop生态圈
资料-CentOS7搭建Hadoop-2.7.7集群
ClickHouse官方中文文档
ETL流程、数据流图及ETL过程解决方案
Google-MapReduce中文版_1.0
Hadoop安装及分布式部署
Hadoop精选面试题和MapReduce编程企业级编程实践
HDFS-part2-原理详解
HDFS核心内容及命令-2020
hive安装
hive语法和常用函数
Kafka安装
kylin安装
mapreduce调优指南
sqoop安装
二、架构篇
Flink-1.11 Hive集成与批流一体
ClickHouse在苏宁用户画像场景的实践
优酷大数据 OLAP 技术选型
阿里数据湖选型
各种系统架构图与详细说明
关于BI工具选型的参考依据
Apache Doris在京东搜索实时OLAP中的应用
ClickHouse官方中文文档
ClickHouse原理解析与应用实践
Doris竞品对比
Doris在美团外卖数仓架构中业务实践与改进思路
DorisDB原理剖析 和应用实践篇2021
Flink 流批一体的技术架构以及在阿里的实践
Flink实时仓库实践
Hadoop开源相关,Flink,Kylin等集群搭建2021
KylinCloud+Hudi实践
三、数仓篇
传统数仓与大数据数仓区别
模板-事实表梳理
模板-维度梳理
模板-业务梳理
模板-指标体系梳理
模板1-数据仓库项目计划
模板2-命名规范
模板3_访谈提问和沟通记录单模板
模板4_公共数据资源管理调研模板
模板5_公共数据资源管理分析模板
模板6-报表需求梳理
内部分享-基于 Hudi 和 Kylin 构建准实时高性能数据仓库
商业银行数据仓库系统V2.0
数据仓库建设方案
数据仓库建设规范模板
数据仓库整体设计方案模板
Hadoop构建数据仓库实践
四、治理篇
快手从模型规范开始的数据治理实践
第12章元数据管理-DAMA-DMBOK:数据管理知识体系
权限管理设计方案
数据安全模板-访问权限梳理表
数据治理服务解决方案
数据治理及数据资产化创新实践-京东
万振龙:数据治理与大数据平台设计
主数据管理实践白皮书(1.0版)
Apache atlas使用说明文档
atlas安装
CDH启用kerberos身份认证和sentry权限管理
DAMA-部委级数据治理项目经验分享
GrowingIO 2020指标体系与数据采集
GrowingIO公开课:搭建业务+数据一体化的指标体系
IBM 数据治理统一流程
ISO38500 IT治理国际标准 ISO_IEC_38500_2008_version_PDF
五、案例篇
字节Apache Flink在字节跳动的实践
Hudi on Flink在顺丰的实践应用-蔡适择
滴滴Flink在滴滴出行的应用与实践
阿里基于Flink的实时计算平台
菜鸟在物流场景中基于Apache Flink的流计算实践
腾讯clickhouse实践
Clickhouse玩转每天千亿数据-趣头条
微博基于Flink的机器学习实践
快手稳定性体系建设
快手元数据平台化建设及应用场景
快手指标规范化及OneService平台化实战
Apache Flink 在美团的实践与应用
快手服务治理平台+KESS+的设计理念和实战
快手数据中台建设:大数据服务化之路
快手离线数据全链路分级保障平台化建设
快手万亿级实时 OLAP 平台的建设与实践
ClickHouse在快手的大规模应用与架构改进
美团点评酒旅数据仓库建设实践
美团酒旅数据治理实践
美团外卖为何使用Doris创建数据仓库
内部分享-基于 Hudi 和 Kylin 构建准实时高性能数据仓库
实时数据产品实践——美团大交通战场沙盘
ClickHouse在苏宁用户画像场景的实践
腾讯云clickhouse性能调优实践
融合趋势下基于 Flink Kylin Hudi 湖仓一体的大数据生态体系
ClickHouse 在头条的技术演进
Doris的用户画像人群应用-会议组
Doris在美团外卖数仓架构中业务实践与改进思路
Flink 在 OPPO 的平台研发与应用实践
Flink实时仓库实践
Flink在滴滴的应用实践