只为小站
首页
域名查询
文件下载
登录
Hadoop
原理与技术
hdfs命令行基本操作
一、实验目的 熟悉hdfs命令行基本操作 二、实验环境 Windows 10 VMware Workstation Pro虚拟机 Hadoop环境 Jdk1.8 三、实验内容 1:hdfs常见命令: (1)查看帮助:hdfs dfs -help (2)查看当前目录信息:hdfs dfs -ls / (3)创建文件夹:hdfs dfs -mkdir /文件夹名 (4)上传文件:hdfs dfs -put /本地路径 /hdfs路径 (5)下载文件到本地:hdfs dfs -get /hdfs路径 /本地路径 (6)移动hdfs文件:hdfs dfs -mv /hdfs路径 /hdfs路径 (7)复制hdfs文件:hdfs dfs -cp /hdfs路径 /hdfs路径 (8)删除hdfs文件:hdfs dfs -rm /文件名 (9)删除hdfs文件夹:hdfs dfs -rm -r /文件夹名
2022-05-25 14:07:37
4.98MB
hadoop
hdfs
文档资料
大数据
Hadoop
原理与技术
MapReduce实验
一、实验目的 (1)熟悉Hadoop开发包 (2)编写MepReduce程序 (3)调试和运行MepReduce程序 (4)完成上课老师演示的内容 二、实验环境 Windows 10 VMware Workstation Pro虚拟机 Hadoop环境 Jdk1.8 二、实验内容 1.单词计数实验(wordcount) (1)输入start-all.sh启动hadoop相应进程和相关的端口号 (2)打开网站localhost:8088和localhost:50070,查看MapReduce任务启动情况 (3)写wordcount代码并把代码生成jar包 (4)运行命令 (1):把linus下的文件放到hdfs上 (2):运行MapReduce (5):查看运行结果 (6)网页上查看MapReduce任务 2.矩阵相乘实验(matrix) (1)写matrix代码并把代码生成jar包 (2)运行命令 (1):把linus下的文件放到hdfs上 (2):运行MapReduce (3):查看运行结果 3.网页排名实验(pagerank) (1):写pagerank代码并把代码生成jar包
2022-05-25 14:07:37
10.46MB
hadoop
mapreduce
文档资料
大数据
Hadoop
原理与技术
SparkSQL操作实验
一、实验目的 (1)通过实验掌握 Spark SQL 的基本编程方法; (2)熟悉 RDD 到 DataFrame 的转化方法; (3)熟悉利用 Spark SQL 管理来自不同数据源的数据。 (4)java程序实现SparkSQL 二、实验环境 Windows 10 VMware Workstation Pro虚拟机 Hadoop环境 Jdk1.8 三、实验内容 (一)SparkSQL的基本知识 (1)输入start-all.sh启动hadoop相应进程和相关的端口号 (2)启动Spark分布式集群并查看信息 (3)网页端查看集群信息 (4)启动spark-shell控制台 (5)访问http://localhost:4040可以看到spark web界面 (6)进入/spark/examples/src/main/resources目录,查看该目录下的内容 (7)查看people.json和employees.json的内容 (8)读取people.json、employees.json,创建DataFrame
2022-05-25 12:04:48
10.36MB
hadoop
文档资料
大数据
big
Hadoop
原理与技术
Spark Streaming操作实验
一、实验目的 1.理解Spark Streaming的工作流程。 2.理解Spark Streaming的工作原理。 3.学会使用Spark Streaming处理流式数据。 二、实验环境 Windows 10 VMware Workstation Pro虚拟机 Hadoop环境 Jdk1.8 三、实验内容 (一)Spark Streaming处理套接字流 1:编写处理套接字流的java程序代码 2:导入缺失的jar包 3:把java程序导出为jar包 4:start-all.sh,启动所有进程,并查看情况 5:启动Spark分布式集群并查看信息 6:启动9999端口 7:切换到jar包所在路径 8:提交程序到spark集群上运行 9:监测端口内容,每隔10秒钟输出一次,当有内容出现的时候,单词计数输出内容 10:退出监测,Ctrl+Z,但是这样并没有完全退出监测,到http://localhost:8080/里杀死该任务,也可以使用Ctrl+C完全退出 (二)Spark Streaming处理RDD队列流 (三)Spark Streaming处理文件流
2022-05-25 12:04:47
10.27MB
hadoop
spark
文档资料
大数据
Hadoop
原理与技术
Spark操作实验
一、实验目的 1. 理解Spark编程思想; 2. 学会在Spark Shell中编写Scala程序; 3. 学会在Spark Shell中运行Scala程序。 二、实验环境 Windows 10 VMware Workstation Pro虚拟机 Hadoop环境 Jdk1.8 三、实验内容 (一)Spark基础知识 (1)输入start-all.sh启动hadoop相应进程和相关的端口号 (2)启动Spark分布式集群并查看信息 (3)网页端查看集群信息 (4)启动spark-shell控制台 1:local模式启动 2:登录master服务器,在集群模式下启动 (5)访问http://localhost:4040可以看到spark web界面 (6)从本地文件系统中加载数据 (7)从分布式文件系统HDFS中加载数据 (8)可以调用SparkContext的parallelize方法,在Driver中一个已经存在的数组上创建RDD。 (9)可以调用SparkContext的parallelize方法,在Drive (二)spark运行wordcount程序
2022-05-25 12:04:47
6.74MB
hadoop
spark
文档资料
大数据
Hadoop
原理与技术
Linus命令行基本操作
一、实验目的 Hadoop运行在Linux系统上,因此,需要学习实践一些常用的Linux命令。本实验旨在熟悉常用的Linux操作,为顺利开展后续其他实验奠定基础。 二、实验环境 Windows 10 VMware Workstation Pro虚拟机 Hadoop环境 Jdk1.8 三、实验内容 1:Linus常见命令: (1)创建目录:mkdir 文件夹名 (2)建多层次目录:mkdir -p 文件夹名/文件夹名/文件夹名 (3)同层次建多个文件夹:mkdir 文件夹名/文件夹名 文件夹名/文件夹名 文件夹名/文件夹名 (4)切换目录:cd 文件夹名 (5)显示当前目录路径:pwd (6)显示当前目录下的文件或目录:ls (7)创建空文件:touch 文件夹名 (8)编辑文件内容:vi 文件名 (9)容许编辑文件内容:i (10)保存并退出::wq (11)查看文件内容:cat 文件名 (12)删除文件:rm 文件名字 (13)返回上一层目录:cd.. (14)返回根目录:cd (15)删除文件夹:rm -rf 文件夹名 (16)显示文件系统使用情况:du
2022-05-25 09:07:51
2.01MB
hadoop
文档资料
大数据
big
AN108 原理图技术资料-原理图
AN108 原理图技术资料
2022-05-16 10:28:26
48KB
AN108
原理图
技术资料
1
信息安全
原理与技术
.pptx
信息安全
原理与技术
2022-05-11 19:04:59
781KB
文档资料
信息安全原理与技术
大数据
原理与技术
课程实验报告完整版
13.1实验一:熟悉常用的Linux 操作和Hadoop操作 本实验对应第3章的内容。 13.1.1 实验目的 Hadoop运行在 Linux系统上,因此,需要学习实践一些常用的 Linux命令。本实验旨在熟悉常用的 Linux操作和 Hadoop操作,为顺利开展后续其他实验奠定基础。 13.1.2 实验平台 (1)操作系统:Linux(建议Ubuntu 16.04)。(2)Hadoop版本:2.7.1。
2022-05-05 18:06:00
3.29MB
big
data
文档资料
大数据
SSM三大框架的运行流程原理核心技术详解.docx.zip
Spring+SpringMVC+Mybatis SSM三大框架的运行流程、原理、核心技术详解 理解很透彻, 入门五星推荐
2022-04-28 21:52:21
909KB
SSM
Spring
SpringMVC
Mybatis
1
个人信息
点我去登录
购买积分
下载历史
恢复订单
热门下载
YOLOv5 人脸口罩图片数据集
西门子逻辑控制设计开发_3部10层
2021华为芯片研发岗位笔试题
2019和2021年华为单板通用硬件笔试题及答案
python爬虫数据可视化分析大作业.zip
采用K-means聚类,实现多维矩阵的聚类,并进行可视化展示(matlab)
IBM CPLEX 12.10 学术版 mac操作系统安装包
基于MQ2烟雾传感器的STM32F103程序
2020年数学建模B题穿越沙漠全部代码全国赛二等奖.zip
android studio课程设计作业PPT+设计文档+可运行源代码+设计思路
画程(版本6.0.0.127)setup个人版
拾荒者扫描器.zip
多目标微粒子群算法MOPSO MATLAB代码
JPEG的Matlab实现
基于yolov4-keras的抽烟检测(源码+数据集)
最新下载
k610d i7d2_原厂BIOS 炫龙A41L 大麦2s等广达盲刷bios
AIR-CT2500-K9-8-5-182-0.aes
AIR-CT2500-AP_BUNDLE-K9-8-5-182-0.aes
铭瑄580 8G 镁光颗粒
第十三届 蓝桥杯 单片机 省赛 代码及proteus仿真 IAP15F2K61S2 和AT89C 51单片机都能用
ECS700工程例子
DW-TX382-1并1串专用驱动.zip
openglDemo基本使用Demo
cat4500e-entservicesk9-mz.122-54.SG1.bin
掌讯SD8227 hw 1.0-sw0-6.6 MCU升级文件
其他资源
大连理工大学软件学院编译技术课程——词法分析上机实验
perl-DBD-MySQL-4.013-3.el6.x86_64.rpm
STM32F407_ESP8266连接机智云
ios-仿小红书.zip
使用IIS搭建Web服务器.docx
灰色系统理论教程(邓聚龙)
基于递归下降分析法的语法分析程序(包含PL/0和Yacc实现句子分析程序).rar
oracle从入门到精通明日科技著带目录版
MECHATROLINK-III主站代码
小牛N1维修和检测指导方法
三节串联锂电池充电IC,2款芯片测试板充电测试(1).pdf
Java EE户籍管理系统
标准程序流程图的符号及使用约定.docx
【ssm项目源码】学习管理系统.zip
kapacitor:用于处理,监视和警告时间序列数据的开源框架-源码
Git-2.28.0-64-bit.zip
PowerDirector_Premium_v8.2.0_build_94534.apk
HTTPS原理概述.md
TerraSolid软件教程视频
node_modules
qt_mplayer
Aggregate Channel Features for Multi-view Face Detection英文原文加翻译
kNN相关代码和数据
vb人脸识别技术