刘莎 四川师范大学 使用Hadoop构建云计算平台 Hadoop与云计算全文共13页,当前为第1页。 一个Apache的开源项目; 一个能够对大量数据进行分布式处理的软件架构; 由 HDFS 、 MapReduce 、 HBase 、ZooKeeper 和Hive等成员组成; 在众多企业都得到应用:Yahoo、Facebook、Tiwtter、Amazon、淘宝、网易、百度、中国移动、中科院计算所等。 Hadoop与云计算全文共13页,当前为第2页。 Hadoop Ecosystem Hadoop Architecture: …… Hadoop 集群 Hadoop与云计算全文共13页,当前为第3页。 HDFS 是 Google GFS 的开源版本,一个高度容错的分布式文件系统,它能够提供高吞吐量的数据访问,适合存储海量( PB 级)的大文件(通常超过 64M ),因为HDFS中最小存储粒度为64M。 HDFS Hadoop与云计算全文共13页,当前为第4页。 NameNode 节点作为master,维护集群内的元数据,对外提供创建、打开、删除和重命名文件或目录的功能。 DataNod
2022-07-08 11:05:37
1.13MB
文档资料