内含从同步数据,实时的处理数据到可视化展现数据的操作 需要的软件也都准备好了 适合人群:学过离线数仓,会使用Flink,会Java
2021-03-01 11:02:33 8.15MB 实时数仓 实时大数据
1)学习搭建一个数据仓库的过程,理解数据在整个数仓架构的从采集、存储、计算、 输出、展示的整个业务流程。 2)整个数仓体系完全搭建在阿里云架构上,理解并学会运用各个服务组件,了解各个 组件之间如何配合联动。 3)前置知识要求  熟练掌握SQL语法  熟悉Linux命令  对Hadoop大数据体系有一定的了解
2021-02-24 12:49:59 11.6MB Hadoop 离线数仓 阿里云 项目架构
1
随着互联网飞速发展,企业业务种类会越来越多,业务数据量会越来越大,当发展到一定规模时,传统的数据存储结构逐渐无法满足企业需求,实时数据仓库就变成了一个必要的基础服务。以维表Join为例,数据在业务数据源中以范式表的形式存储,在分析时需要做大量的Join操作,降低性能。如果在数据清洗导入过程中就能流式的完成Join,那么分析时就无需再次Join,从而提升查询性能。利用实时数仓,企业可以实现实时OLAP分析、实时数据看板、实时业务监控、实时数据接口服务等用途。但想到实时数仓,很多人的第一印象就是架构复杂,难以操作与维护。而得益于新版Flink对SQL的支持,以及TiDBHTAP的特性,我们探索了一
1
数仓模型
2021-02-23 17:05:05 80KB 数仓模型介绍
1
基于AWS的云上数仓构建课件.zip
2021-02-22 09:11:57 17.14MB 大数据
1
目录: 仅1年GitHub Star数翻倍,Apache Flink 做了什么? 4 Lyft基于Apache Flink的大规模准实时数据分析平台 15 日均处理万亿数据!Apache Flink在快手的应用实践与技术演进之路 26 bilibili实时平台的架构与实践 47 美团点评基于 Apache Flink 的实时数仓平台实践 70 小米流式平台架构演进与实践 90 Netflix:Evolving Keystone to an Open Collaborative Real-time ETL Platform 108 OPPO 基于 Apache Flink 的实时数仓实践 115
2021-02-21 19:03:09 17.65MB Flink 技术文档 大数据 数仓平台
1
数仓经典销售案例,包括ETL脚本,项目完整详细需求、设计文档及模型加载,推荐。
2021-02-01 12:11:50 1.81MB 数仓 数据仓库
基于Flink SQL的扩展工作,构建实时数仓的应用案例,未来工作的思考和展望4个方面介绍了OPPO基于Flink构建实时数仓的经验和未来的规划。
2021-01-28 04:27:20 1.48MB FLINK 大数据 实时数仓
1
大数据项目实战之在线教育(02数仓实现).doc
2021-01-28 04:26:39 4.1MB 数据仓库
1
亲测可用的JDK、Hadoop、HIVE安装包,配套博文: https://yellow520.blog.csdn.net/article/details/112253651
2021-01-28 04:20:44 817.63MB hadoop hive
1