目录:
第一章 大数据行业与技术趋势
1.1_大数据时代
1.2_大数据的应用领域-华为大数据解决方案
第二章 HDFS分布式文件系统
2.1_HDFS概述及应用场景-HDFS系统架构
2.2_关键特性介绍
第三章 MapReduce分布式离线批处理和Yarn资源协调
3.1_MapReduce和Yarn基本介绍-MapReduce和Yarn功能与架构
3.2_Yarn的资源管理和任务调度-增强特性
第四章 Spark2x基于内存的分布式计算
4.1_Spark概述-Spark原理与架构
4.2_Spark原理与架构-Spark在FusionInsight中的集成情况
第五章 HBase分布式NoSQL数据库
5.1_HBase基本介绍
5.2_HBase功能与架构
5.3_HBase关键流程-HBase华为增强特性
第六章 Hive分布式数据仓库
6.1_Hive概述-Hive功能与架构
6.2_Hive功能与架构-Hive基本操作
第七章 Streaming分布式流计算引擎
7.1_Streaming简介-系统架构
7.2_关键特性介绍-StreamCQL介绍
第八章 Flink流计算处理和批处理平台
8.1_Flink概述-Flink原理与技术架构
8.2_Flink原理与技术架构-Flink在FusionInsight HD中的集成情况
第九章 Loader数据转换
9.1_Loader简介-Loader作业管理
第十章 Flume海量日志聚合
10.1_Flume简介及架构-Flume应用举例
第十一章 Kafka分布式消息订阅系统
11.1_Kafka简介-Kafka架构与功能
11.2_Kafka架构与功能-Kafka关键流程
第十二章 ZooKeeper集群分布式协调服务
12.1_ZooKeeper简介-与组件的关系
第十三章 FusionInsight HD 解决方案介绍
13.1_FusionInsight概述-FusionInsight特性介绍
13.2_FusionInsight HD 成功案例