Apache Hadoop (hadoop-3.3.3.tar.gz)项目为可靠、可扩展的分布式计算开发开源软件。 Apache Hadoop 软件库是一个框架,它允许使用简单的编程模型跨计算机集群分布式处理大型数据集。它旨在从单个服务器扩展到数千台机器,每台机器都提供本地计算和存储。库本身不是依靠硬件来提供高可用性,而是设计用于检测和处理应用层的故障,因此在计算机集群之上提供高可用性服务,每台计算机都可能容易出现故障。
2022-05-29 10:05:00 615.16MB ApacheHadoop hadoop
Apache Hadoop (hadoop-3.2.3.tar.gz)项目为可靠、可扩展的分布式计算开发开源软件。 Apache Hadoop 软件库是一个框架,它允许使用简单的编程模型跨计算机集群分布式处理大型数据集。它旨在从单个服务器扩展到数千台机器,每台机器都提供本地计算和存储。库本身不是依靠硬件来提供高可用性,而是设计用于检测和处理应用层的故障,因此在计算机集群之上提供高可用性服务,每台计算机都可能容易出现故障。
2022-05-29 10:05:00 468.25MB ApacheHadoop hadoop
MRGraphSearch Apache Hadoop 的简单 MapReduce 图搜索算法。 它计算未加权图中两个指定顶点之间的距离。
2022-05-23 11:20:42 14KB Java
1
本教程为授权出品 一、课程简介数据仓库(Data Warehouse,可简写为DW或DWH),是面向分析的集成化数据环境,为企业决策制定过程,提供系统数据支持的战略集合,是国内外各大公司正在重点投入的战略级技术领域。 二、课程内容《大数据电商数仓项目实战》视频教程,从项目架构的搭建,到数据采集模块的设计、数仓架构的设计、实战需求实现、即席查询的实现,我们针对国内目前广泛使用的Apache原生框架和CDH版本框架进行了分别介绍,Apache原生框架介绍中涉及到的技术框架包括Flume、Kafka、Sqoop、MySql、HDFS、Hive、Tez、Spark、Presto、Druid等,CDH版本框架讲解包括CM的安装部署、Hadoop、Zookeeper、Hive、Flume、Kafka、Oozie、Impala、HUE、Kudu、Spark的安装配置,透彻了解不同版本框架的区别联系,将大数据全生态系统前沿技术一网打尽。在过程中对大数据生态体系进行了系统的讲解,对实际企业数仓项目中可能涉及到的技术点都进行了深入的讲解和探讨。同时穿插了大量数仓基础理论知识,让你在掌握实战经验的同时能
1
本文总结了ApacheHadoop和Cloudera Hadoop的版本衍化过程,并给出了选择Hadoop版本的一些建议。感兴趣的朋友一起看看吧
2022-04-26 09:27:35 161KB apache hadoop版本
1
jmx prometheus grafana 监控开源hadoop各个组件模板。 Hadoop、Zookeeper、HBase等包含12个json模板 导入即可使用,不许做任何修改。
2022-04-13 17:05:29 51KB apache hadoop 大数据 big
带图带说明:Hadoop简介及Apache Hadoop三种搭建方式
2022-04-06 02:49:16 13.52MB apache hadoop zookeeper 分布式
TonY TonY是一个框架,可在Apache Hadoop上本地运行深度学习作业。 它目前支持TensorFlow,PyTorch,MXNet和Horovod。 TonY可以作为Hadoop应用程序运行单节点或分布式培训TonY TonY是一个框架,可在Apache Hadoop上本地运行深度学习作业。 它目前支持TensorFlow,PyTorch,MXNet和Horovod。 TonY支持将单个节点或分布式培训作为Hadoop应用程序运行。 该本地连接器与其他TonY功能一起,旨在可靠,灵活地运行机器学习作业。 有关TonY的快速概述以及与其他框架的比较,请参阅此演示文稿。 兼容性说明建议在以下情况下运行TonY:
2022-03-04 10:40:14 1.38MB Python Deep Learning
1
Apache Hadoop (hadoop-2.10.1-src.tar.gz 源代码)项目为可靠、可扩展的分布式计算开发开源软件。 Apache Hadoop 软件库是一个框架,它允许使用简单的编程模型跨计算机集群分布式处理大型数据集。它旨在从单个服务器扩展到数千台机器,每台机器都提供本地计算和存储。库本身不是依靠硬件来提供高可用性,而是设计用于检测和处理应用层的故障,因此在计算机集群之上提供高可用性服务,每台计算机都可能容易出现故障。
2022-02-17 14:15:26 42.94MB Hadoop ApacheHadoop
Apache Hadoop (hadoop-3.2.2-src.tar.gz 源代码)项目为可靠、可扩展的分布式计算开发开源软件。 Apache Hadoop 软件库是一个框架,它允许使用简单的编程模型跨计算机集群分布式处理大型数据集。它旨在从单个服务器扩展到数千台机器,每台机器都提供本地计算和存储。库本身不是依靠硬件来提供高可用性,而是设计用于检测和处理应用层的故障,因此在计算机集群之上提供高可用性服务,每台计算机都可能容易出现故障。
2022-02-17 14:15:25 31.14MB Hadoop ApacheHadoop