上传者: 43934844
|
上传时间: 2022-06-21 22:03:46
|
文件大小: 7.14MB
|
文件类型: PPTX
大数据平台简介 大数据平台简介全文共176页,当前为第1页。 Hadoop生态系统 大数据平台简介全文共176页,当前为第2页。 Hadoop 1.0 V 2.0 大数据平台简介全文共176页,当前为第3页。 Hadoop生态系统 Ambari (安装部署工具) Zookeeper (分布式协调服务) HBase (分布式协数据库) Oozie (作业流调度系统) HDFS (分布式存储系统) YARN (分布式计算框架) MapReduce (离线计算) Tez (DAG计算) Spark (内存计算) Hive Pig Mahout Sqoop (数据库TEL工具) Flume (日志收集) …… …… 大数据平台简介全文共176页,当前为第4页。 HDFS-Hadoop Distributed File System 大数据平台简介全文共176页,当前为第5页。 Yarn-资源管理器 大数据平台简介全文共176页,当前为第6页。 MapReduce-分布式并行计算框架 "你数一号书架,我数二号书架。我们人数多,数书就更快。这就是map;最后我们到一起,把所有人的统计数加在一起,就