上传者: 27595745
|
上传时间: 2021-09-06 13:13:17
|
文件大小: 1.05MB
|
文件类型: PPTX
【Outlines】
Hadoop Overview
HDFS
Map-reduce Programming Paradigm
Hadoop Map-reduce
Job Scheduler
Resources
Hadoop, Why?
数据太多了,需要能存储、快速分析Pb级数据集的系统
单机的存储、IO、内存、CPU有限,需要可扩展的集群
使用门槛低,数据分析是个庞杂的问题,MPI太复杂
单点故障问题
–机器多了单点故障成为正常的异常
–节点有增有减
Hadoop就是一个满足易用性、可靠性、可扩展性的存储计算平台,还是开源的!