Apache Hadoop (hadoop-3.3.4.tar.gz)项目为可靠、可扩展的分布式计算开发开源软件。官网下载速度非常缓慢,因此将hadoop-3.3.4 版本放在这里,欢迎大家来下载使用!
Hadoop 架构是一个开源的、基于 Java 的编程框架,设计用于跨电脑集群来
处理大数据。Hadoop 是一个能够让用户轻松搭建和使用的分布式计算平台,能
够让用户轻松地在 Hadoop 上开发和运行处理海量数据的应用程序。
Hadoop 架构有两个主要的组件:分布式文件系统 HDFS 和 MapReduce 引擎。
在 Hadoop 中,MapReduce 底层的分布式文件系统是独文模块,用户可按照约定
的一套接口实现自己的分布式文件系统,然后经过简单的配置后,存储在该文件
系统上的数据便可以被 MapReduce 处理。
官网下载速度非常缓慢,因此将hadoop-3.3.4 版本放在这里,欢迎大家来下载使用!
1