Hadoop大数据开发实战-教学设计.zip
2022-07-08 11:08:17 3.73MB 教学资料
内容:包括cm与cdh两个包 使用人群:大学生、数据开发
2022-07-01 09:08:54 155B hadoop 大数据 spark
大数据运维技术第2章 Hadoop平台安装课件.pptx
2022-06-22 13:09:34 2.58MB Hadoop 大数据
YARN配置、启动与验证 YARN配置、启动与验证 序号 任务名称 任务一 YARN组件参数配置 任务二 MapReduce组件参数配置 任务三 配置SSH无密钥登录(slave1为主节点) 任务四 分发YARN与MapReduce配置文件 任务五 启动YARN集群 任务六 启动历史服务 任务七 验证YARN集群与历史服务 任务一 YARN组件参数配置 编辑 yarn-site.xml 配置文件(yarn参数配置文件) yarn.nodemanager.aux-services mapreduce_shuffle   yarn.resourcemanager.hostname slave1 yarn.log-aggregation-enable true
2022-06-21 12:05:03 425KB Hadoop 大数据 YARN
测试Job 序号 任务名称 任务一 准备MapReduce输入文件 任务二 将输入文件上传到HDFS 任务三 运行MapReduce程序测试Job 任务一 准备MapReduce输入文件 在master主节点,使用 root 用户登录,然后切换为 hadoop用户 [root@master ~]# su – hadoop --从root用户切换为hadoop身份 [hadoop@master ~]$ 创建新文件:wc.input 作为 MapReduce输入文件,输入以下内容,然后保存文件 [hadoop@master ~]$ vi wc.input hadoop mapreduce hive spark hbase spack storm sqoop hadoop hive spark hadoop 查看输入的文件内容 [hadoop@master ~]$ more wc.input 任务二 将输入文件上传到HDFS 在master主节点,使用 root 用户登录,然后切换为 hadoop用户 [root@master ~]# su – hadoop --从root用户切换为hado
2022-06-21 12:04:49 486KB Hadoop 大数据
规划Hadoop大数据平台集群 Hadoop集群的三种模式 单机模式 在单机上运行。 没有分布式文件系统,直接读写本地操作系统。 伪分布模式 在单机上运行。 使用分布式文件系统。 hadoop集群只有一个节点,因此hdfs的块复制将限制为单个副本。 在单个节点上运行NameNode、DataNode、JobTracker、TaskTracker、SeconderyNameNode 这5个进程。 完全分布模式 在多个节点上运行。 使用分布式文件系统。 在不同的节点上运行NameNode、DataNode、JobTracker、TaskTracker、SeconderyNameNode 这5个进程中的某几个。 在一台服务器上使用虚拟机软件虚拟所有的节点,也属于完全分布模式,在一些数据量比较少的公司集群就是这样部署的。 完全分布模式Hadoop大数据平台集群 - 服务器角色规划 Master (IP:192.168.128.128) Slave1 (IP:192.168.128.129) Slave2 (IP:192.168.128.130) NameNode SecondaryNameNo
2022-06-21 12:04:49 455KB Hadoop 大数据
Hadoop基础环境配置 基础环境配置 序号 任务名称 任务一 安装集群主节点 任务二 配置集群主机映射表 任务三 关闭防火墙与SELinux 任务四 安装JDK 任务五 安装时间同步服务(chrony) 任务六 克隆或复制集群从节点 任务七 新建Hadoop用户 任务八 配置SSH无密钥登录(master为主节点) 任务一 安装集群主节点 创建一台虚拟机。在虚拟机软件VMWare Workstation中创建一台服务器,作为集群主节点,服务器主要硬件配置:2CPU、2G内存、20G硬盘,网络模式:NAT。 安装CentOS操作系统。在master 主节点服务器上安装CentOS 7操作系统,设置超级用户root的密码,安装完成之后设置主机名为:master。 使用 ip 命令获得master主节点服务器的IP地址、路由、域名服务器等信息。 使用远程终端软件(如:SecureCRT等)远程登录master主节点服务器。 配置好主节点服务器的静态IP地址,如:192.168.128.128。 安装完成之后,在虚拟机软件VMWare Workstation中创建一个快照。 任务二 配置集群
2022-06-21 12:04:48 386KB Hadoop 大数据
HDFS配置、启动与验证 HDFS配置、启动与验证 序号 任务名称 任务一 Hadoop安装及JDK环境变量配置 任务二 HDFS组件参数配置 任务三 配置Hadoop环境变量 任务四 分发Hadoop文件 任务五 NameNode格式化 任务六 启动HDFS集群 任务七 验证HDFS集群 任务一 Hadoop安装及JDK环境变量配置 所有节点,使用 root 用户登录,修改 /opt 的权限 # chmod 777 /opt --修改 /opt 文件夹的权限,使得 hadoop用户可读写 主节点使用 hadoop 用户登录 [root@master ~]# su – hadoop --从root用户切换为hadoop身份 通过 SecureCRT 软件上传 Hadoop安装文件到 /opt 目录,再由hadoop用户解压 [hadoop@master ~]$ cd /opt [hadoop@master opt]$ tar –zxvf hadoop-2.8.5.tar.gz 配置JDK环境变量,修改 hadoop解压缩后 etc 目录下的 hadoop-env.sh、mapred-e
2022-06-20 18:08:06 398KB Hadoop 大数据
hadoop大数据课程设计,爬虫项目,python
2022-06-17 19:20:40 8KB hadoop 大数据 课程设计 python
1
用-Hadoop-进行分布式数据处理
2022-06-17 14:09:12 903KB hadoop 大数据 分布式 数据处理