此文件为hadoop-2.7.7.tar.gz,可在linux下直接进行安装,如在windows上安装,则需要hadooponwindows-master.zip,用windows-master里的文件替换解压好后hadoop的bin和etc即可。 Hadoop 2.7.7是一款开源的分布式计算框架,由Apache基金会所开发。它的核心组件包括分布式文件系统HDFS和离线计算框架MapReduce。Hadoop 2.7.7支持完全分布式集群部署,具有高可靠性、高可扩展性、高容错性等特性。此外,该版本还提供了数据节点数据存储的节点位置定义功能,允许用户根据实际情况确定磁盘的挂载目录并进行分割。总的来说,Hadoop 2.7.7是一款适用于处理大规模数据的可靠工具。
2024-05-13 09:45:43 215.42MB hadoop linux
1
1.# 基于docker技术搭建Hadoop与MapReduce分布式环境 2.# 基于hadoop与MapReduce的分布式编程 3.# HDFS基本操作实验 4.# 使用docker构建spark运行环境 5.# 使用mllib完成mnist手写识别任务
2024-05-12 17:51:14 4.61MB hadoop
1
基于Spark框架的新闻推荐系统的设计与实现
2024-04-26 15:10:34 6.76MB
1
Centos+Hadoop+Hive+HBase
2024-04-24 19:31:16 730KB Hadoop Hive HBase
1
是大数据课程大作业,基于Hadoop的电影影评数据分析,需要安装Hadoop,了解MapReduce 和HDFS。
2024-04-22 15:09:31 1.49MB hadoop 数据分析
1
Hadoop大数据开发案例教程与项目实战
2024-04-18 21:31:05 133.22MB Hadoop
1
如果你的计算机上已经安装了Hadoop,本步骤可以略过。这里假设没有安装。如果没有安装Hadoop,请访问Hadoop安装教程_单机/伪分布式配置_Hadoop2.6.0/Ubuntu14.04,依照教程学习安装即可。注意,在这个Hadoop安装教程中,就包含了Java的安装,所以,按照这个教程,就可以完成JDK和Hadoop这二者的安装。
2024-04-18 20:49:00 127KB hadoop spark
1
文档非常详细,分为四个部分: ①VMware的安装 ②VMware下安装Ubuntu ③Hadoop的安装与配置 ④Spark的安装配置
2024-04-18 20:47:14 7.7MB spark hadoop vmware ubuntu
1
这个数据集是顾客对各个商家餐饮服务的评价由标签和评价两个数据项组成。 label=1(正向评价) label=0(负向评价) 用jieba(自然语言处理)库对用户评价进行分类,对商家的餐饮质量进行分析,把商家更加直观的呈现给顾客,让顾客选择更方便简洁。
2024-04-16 20:40:14 936KB hadoop 餐饮行业
1
基于hadoop2.7.2,scala2.11的sparklinux软件包,解压到指定目录后即可使用,实测可行
2024-04-13 17:58:26 191.82MB spark
1