搜索【hadoop spark】的结果

规划Hadoop大数据平台集群 Hadoop集群的三种模式单机模式在单机上运行。没有分布式文件系统，直接读写本地操作系统。伪分布模式在单机上运行。使用分布式文件系统。 hadoop集群只有一个节点，因此hdfs的块复制将限制为单个副本。在单个节点上运行NameNode、DataNode、JobTracker、TaskTracker、SeconderyNameNode 这5个进程。完全分布模式在多个节点上运行。使用分布式文件系统。在不同的节点上运行NameNode、DataNode、JobTracker、TaskTracker、SeconderyNameNode 这5个进程中的某几个。在一台服务器上使用虚拟机软件虚拟所有的节点，也属于完全分布模式，在一些数据量比较少的公司集群就是这样部署的。完全分布模式Hadoop大数据平台集群 - 服务器角色规划 Master （IP：192.168.128.128） Slave1 （IP：192.168.128.129） Slave2 （IP：192.168.128.130） NameNode SecondaryNameNo

2022-06-21 12:04:49 455KB Hadoop 大数据

Hadoop大数据平台构建、基础环境配置教学课件.pptx

Hadoop基础环境配置基础环境配置序号任务名称任务一安装集群主节点任务二配置集群主机映射表任务三关闭防火墙与SELinux 任务四安装JDK 任务五安装时间同步服务（chrony）任务六克隆或复制集群从节点任务七新建Hadoop用户任务八配置SSH无密钥登录（master为主节点）任务一安装集群主节点创建一台虚拟机。在虚拟机软件VMWare Workstation中创建一台服务器，作为集群主节点，服务器主要硬件配置：2CPU、2G内存、20G硬盘，网络模式：NAT。安装CentOS操作系统。在master 主节点服务器上安装CentOS 7操作系统，设置超级用户root的密码，安装完成之后设置主机名为：master。使用 ip 命令获得master主节点服务器的IP地址、路由、域名服务器等信息。使用远程终端软件（如：SecureCRT等）远程登录master主节点服务器。配置好主节点服务器的静态IP地址，如：192.168.128.128。安装完成之后，在虚拟机软件VMWare Workstation中创建一个快照。任务二配置集群

2022-06-21 12:04:48 386KB Hadoop 大数据

大数据实验六实验报告：熟悉Hive的基本操作

“大数据技术原理与应用”课程实验报告题目：实验六：熟悉Hive的基本操作姓名：小猪猪日期：2022/5/15 1、实验环境：设备名称 LAPTOP-9KJS8HO6 处理器 Intel(R) Core(TM) i5-10300H CPU @ 2.50GHz 2.50 GHz 机带 RAM 16.0 GB (15.8 GB 可用) 主机操作系统 Windows 10 家庭中文版虚拟机操作系统 ubuntukylin-16.04 Hadoop 版本 3.1.3 JDK 版本 1.8 Java IDE：Eclipse 系统类型 64 位操作系统, 基于 x64 的处理器笔和触控没有可用于此显示器的笔或触控输入 2、实验内容与完成情况： 1.创建一个内部表 stocks，字段分隔符为英文逗号，表结构如下所示： stocks 表结构：

2022-06-21 09:11:30 1.44MB 大数据 Hive hadoop java

基于Spark图计算的社会网络分析系统.zip

资源包含文件：课程论文word+项目源码本文在 Spark 及图计算引擎 GraphX 的基础上，设计并实现一套用于顶点分析的社交网络分析系统，为使用 Spark 进行大规模社交网络的顶点分析提供具体接口，包括社交网络的图模型构建、顶点重要度估值、顶点间路径的计算、顶点分组等接口，并对计算结果进行了一定程度上的可视化展现。主要工作包括两个方面:第一是构建图和数据可视化的实现;第二是具体的顶点分析接口的实现。详细介绍参考：https://biyezuopin.blog.csdn.net/article/details/124983932

2022-06-21 09:11:23 9.42MB Spark 图计算 GraphX 社会网络分析系统

Hadoop大数据平台构建、HDFS配置、启动与验证教学课件.pptx

HDFS配置、启动与验证 HDFS配置、启动与验证序号任务名称任务一 Hadoop安装及JDK环境变量配置任务二 HDFS组件参数配置任务三配置Hadoop环境变量任务四分发Hadoop文件任务五 NameNode格式化任务六启动HDFS集群任务七验证HDFS集群任务一 Hadoop安装及JDK环境变量配置所有节点，使用 root 用户登录，修改 /opt 的权限 # chmod 777 /opt --修改 /opt 文件夹的权限，使得 hadoop用户可读写主节点使用 hadoop 用户登录 [root@master ~]# su – hadoop --从root用户切换为hadoop身份通过 SecureCRT 软件上传 Hadoop安装文件到 /opt 目录，再由hadoop用户解压 [hadoop@master ~]$ cd /opt [hadoop@master opt]$ tar –zxvf hadoop-2.8.5.tar.gz 配置JDK环境变量，修改 hadoop解压缩后 etc 目录下的 hadoop-env.sh、mapred-e

2022-06-20 18:08:06 398KB Hadoop 大数据

hadoop3.x的Windows依赖.rar

hadoop3.x的Windows依赖，使用IDEA并创建Maven工程之后，导入该文件中pom文件即可完成配置，同时该资源内置了可以直接使用的pom文件

2022-06-20 18:07:50 889KB hadoop

1

大数据实验5实验报告：MapReduce 初级编程实践

林子雨大数据原理与技术第三版实验5实验报告大数据技术与原理实验报告 MapReduce 初级编程实践姓名: 实验环境：  操作系统：Linux（建议Ubuntu16.04）；  Hadoop版本：3.2.2；实验内容与完成情况：（一）编程实现文件合并和去重操作对于两个输入文件，即文件 A 和文件 B，请编写 MapReduce 程序，对两个文件进行合并，并剔除其中重复的内容，得到一个新的输出文件 C。下面是输入文件和输出文件的一个样例供参考。输入文件 A 的样例如下：

2022-06-20 18:07:49 1.28MB 大数据 mapreduce Hadoop

实验1 安装Hadoop.doc

教大家怎么安装Hadoop的一个文档： 1、掌握Linux虚拟机的搭建； 2、掌握Linux的常用命令及操作； 3、熟练掌握Hadoop安装及配置； 4、了解Hadoop的简单应用。

2022-06-20 12:47:27 8.03MB 安装Hadoop.d

1

编写Java程序，实现统计单词个数功能

1. 创建目录 2. mkdir wcinput 3. 在创建好的文件夹中创建文件wc.input，输入一些内容，例如 zhangsan zhangsan ss ss cls cls jiao 4. 将wc.input上传到HDFS上 hadoop fs -copyFromLocal wcinput/ /user/ 5. 调用上传的jar包，实现单词计数功能 hadoop jar wordcount.jar com.only.mapreduce.wordcount.WordcountDriver /user/wcinput /user/wcoutput 6. 查看结果 hadoop fs -

2022-06-20 10:37:42 292KB hadoop

1

hadoop-2.6.0-cdh5.14.2.tar

hadoop-2.6.0-cdh5.14.2.tar.gz适用于Linux环境，centos7已测试

2022-06-19 22:29:56 768.19MB hadoop hadoop-2.6.0 Linux-Hadoop

1

个人信息

热门下载

最新下载

其他资源