前 言
大数据学习路线
大数据技术栈思维导图
大数据常用软件安装指南
一、Hadoop
分布式文件存储系统:HDFS
分布式计算框架:MapReduce
集群资源管理器:YARN
单机伪集群环境搭建
集群环境搭建
常用 Shell 命令
Java API 的使用
基于 Zookeeper 搭建 Hadoop 高可用集群
二、Hive
简介及核心概念
Linux 环境下 Hive 的安装部署
CLI 和 Beeline 命令行的基本使用
常用 DDL 操作
分区表和分桶表
视图和索引
常用 DML 操作
数据查询详解
三、Spark
Spark Core
Spark SQL
Spark Streaming
五、Flink
核心概念综述
开发环境搭建
Data Source
Data Transformation
Data Sink
窗口模型
状态管理与检查点机制
Standalone 集群部署
六、HBase
简介
系统架构及数据结构
基本环境搭建
集群环境搭建
常用 Shell 命令
Java API
过滤器详解
可显示字数有限,详细内容请看资源。
1