针对Hadoop集群部署过程繁琐复杂、耗时费力、运维难度大,且不利于快速扩展的问题,提出一种结合Docker容器技术部署集群的解决方法。该方法把Ambari及其运行环境和配置构建成Docker镜像,并把多节点容器的运行和Hadoop集群的部署过程写成Shell脚本,只需一条命令,即可实现集群的自动化部署。实验结果表明,该方法简单可靠并极大地提高了集群部署的效率。因此,对海量数据的处理和分析具有重要的推动作用。
2022-05-29 11:09:07 722KB 工程技术 论文
1
Apache Hadoop (hadoop-3.3.3-src.tar.gz)项目为可靠、可扩展的分布式计算开发开源软件。 Apache Hadoop 软件库是一个框架,它允许使用简单的编程模型跨计算机集群分布式处理大型数据集。它旨在从单个服务器扩展到数千台机器,每台机器都提供本地计算和存储。库本身不是依靠硬件来提供高可用性,而是设计用于检测和处理应用层的故障,因此在计算机集群之上提供高可用性服务,每台计算机都可能容易出现故障。
2022-05-29 10:05:02 33.98MB ApacheHadoop hadoop
Apache Hadoop (hadoop-3.2.3-src.tar.gz)项目为可靠、可扩展的分布式计算开发开源软件。 Apache Hadoop 软件库是一个框架,它允许使用简单的编程模型跨计算机集群分布式处理大型数据集。它旨在从单个服务器扩展到数千台机器,每台机器都提供本地计算和存储。库本身不是依靠硬件来提供高可用性,而是设计用于检测和处理应用层的故障,因此在计算机集群之上提供高可用性服务,每台计算机都可能容易出现故障。
2022-05-29 10:05:01 31.61MB ApacheHadoop hadoop
Apache Hadoop (hadoop-3.3.3.tar.gz)项目为可靠、可扩展的分布式计算开发开源软件。 Apache Hadoop 软件库是一个框架,它允许使用简单的编程模型跨计算机集群分布式处理大型数据集。它旨在从单个服务器扩展到数千台机器,每台机器都提供本地计算和存储。库本身不是依靠硬件来提供高可用性,而是设计用于检测和处理应用层的故障,因此在计算机集群之上提供高可用性服务,每台计算机都可能容易出现故障。
2022-05-29 10:05:00 615.16MB ApacheHadoop hadoop
Apache Hadoop (hadoop-3.2.3.tar.gz)项目为可靠、可扩展的分布式计算开发开源软件。 Apache Hadoop 软件库是一个框架,它允许使用简单的编程模型跨计算机集群分布式处理大型数据集。它旨在从单个服务器扩展到数千台机器,每台机器都提供本地计算和存储。库本身不是依靠硬件来提供高可用性,而是设计用于检测和处理应用层的故障,因此在计算机集群之上提供高可用性服务,每台计算机都可能容易出现故障。
2022-05-29 10:05:00 468.25MB ApacheHadoop hadoop
大数据是从各种来源快速生成的各种格式的大量不精确数据。 这是研究人员、工业界和学术界最热门的术语。 大数据不仅限于数据视角,它已经以包括相关技术、工具和实际应用程序在内的流形式出现。 本文的目的是为该学科的初学者提供一个简单、全面和简要的大数据介绍。 在本文中,我们概述了 Hadoop 及其子项目,并简要回顾了各种已开发的大数据技术。 我们还讨论了大数据中的一些最新趋势和杰出应用。 虽然这篇论文没有涉及大数据的每一个维度,因为不可能在一篇论文中完成,但涵盖了基本方面,这可能会使大数据世界的新手受益。
2022-05-28 17:29:27 372KB Big Data Hadoop
1
Spark环境测试
2022-05-28 09:05:03 13KB spark 综合资源 大数据 big
1
基于Hadoop、Spark的大数据金融信贷风险控系统源码.zip
2022-05-27 19:07:49 72KB big data 源码软件 hadoop
hadoop、spark、NoSQL实战,全版本,高清晰pdf,要的拿走
2022-05-27 17:56:23 34.38MB hadoop spark
1
Elasticsearch Hadoop 作为一个完美的工具,用来连接Elasticsearch 和 Hadoop 的生态系统。
2022-05-27 17:27:28 42.11MB Hadoop
1