大数据技术与应用.pdf
2022-06-07 17:04:39 12.49MB
大数据技术在污水处理运营中的应用.pdf
2022-06-04 18:01:03 763KB big data 文档资料 大数据
大多数大数据企业在构建数仓时采用Lambda架构,一条离线数仓链路,一条实时数仓链路。一些实时业务多的公司构建数仓时采用Kappa架构,但是也避免不了离线处理一些数据,所以一些公司也采用Kappa架构+Lambda架构方式构建数仓。以上不同的架构都有各自的优点及缺点,这里不再赘述。批数据处理与流式数据处理的不同效率决定了针对两类数据采用不同的架构进行分析处理,未来数据仓库的发展也终将走向批数据和流数据使用同一套架构处理,同时也要求批数据及流数据存储上也需要统一,这就所说的批流一体,那么使用什么技术可以既能满足批数据海量存储分析又能满足实时数据存储的效率高、支持数据更新删除?数据湖技术应运而生。Hudi 就是典型的数据湖技术,支持批数据和流式数据的存储,同时还支持高效的OLAP分析查询。 这份资料将会带领大家学习为什么要用数据湖技术、Hudi Timeline、Hudi文件格式及索引、Hudi表类型、Hudi与Spark、Flink框架整合等知识,如果你在学习、工作中针对批流一体数据处理场景正不知选择何种技术,在工作中使用到数据湖技术,那么下载这份资料绝对没错,可以快速学习真正使用数据湖
2022-06-04 09:07:16 60.19MB 数据湖 大数据技术
基于大数据技术的计算机网络安全问题分析.docx
2022-06-03 09:01:16 23KB 互联网
基于大数据技术的消费金融风控策略研究.docx
2022-06-03 09:01:15 26KB 互联网
基于大数据技术的消费金融风控策略研究.docx
2022-06-03 09:01:14 26KB 互联网
基于大数据技术的企业上市孵化数据管理.docx
2022-06-03 09:01:13 26KB 互联网
基于大数据技术的BI分析系统在财务管理方面的应用.docx
2022-06-03 09:01:12 28KB 互联网
·MapReduce是一个用于处理海量数据的分布式计算框架。 ·这个框架解决了 ·数据分布式存储 ·作业调度 ·容错 ·机器间通信等复杂问题
2022-05-31 09:09:11 862KB big data mapreduce 源码软件
大数据是从各种来源快速生成的各种格式的大量不精确数据。 这是研究人员、工业界和学术界最热门的术语。 大数据不仅限于数据视角,它已经以包括相关技术、工具和实际应用程序在内的流形式出现。 本文的目的是为该学科的初学者提供一个简单、全面和简要的大数据介绍。 在本文中,我们概述了 Hadoop 及其子项目,并简要回顾了各种已开发的大数据技术。 我们还讨论了大数据中的一些最新趋势和杰出应用。 虽然这篇论文没有涉及大数据的每一个维度,因为不可能在一篇论文中完成,但涵盖了基本方面,这可能会使大数据世界的新手受益。
2022-05-28 17:29:27 372KB Big Data Hadoop
1