Hadoop, Apache开源的分布式框架。源自Google GFS,BigTable,MapReduce 论文。
== HDFS ==
HDFS (Hadoop Distributed File System),Hadoop 分布式文件系统。
NameNode,HDFS命名服务器,负责与DataNode文件元信息保存。
DataNode,HDFS数据节点,负责存储数据存储并汇报给NameNode。
SecondaryNamenode,NameNode的镜像备份节点
==Map Reduce==
JobTracker,hadoop的Map/Reduce调度器,负责与TackTracker通信分配计算任务并跟踪任务进度。
TaskTracker,启动和管理Map和Reduce子任务的节点。