只为小站
首页
域名查询
文件下载
登录
Hadoop
原理与技术
hdfs命令行基本操作
一、实验目的 熟悉hdfs命令行基本操作 二、实验环境 Windows 10 VMware Workstation Pro虚拟机 Hadoop环境 Jdk1.8 三、实验内容 1:hdfs常见命令: (1)查看帮助:hdfs dfs -help (2)查看当前目录信息:hdfs dfs -ls / (3)创建文件夹:hdfs dfs -mkdir /文件夹名 (4)上传文件:hdfs dfs -put /本地路径 /hdfs路径 (5)下载文件到本地:hdfs dfs -get /hdfs路径 /本地路径 (6)移动hdfs文件:hdfs dfs -mv /hdfs路径 /hdfs路径 (7)复制hdfs文件:hdfs dfs -cp /hdfs路径 /hdfs路径 (8)删除hdfs文件:hdfs dfs -rm /文件名 (9)删除hdfs文件夹:hdfs dfs -rm -r /文件夹名
2022-05-25 14:07:37
4.98MB
hadoop
hdfs
文档资料
大数据
Hadoop
原理与技术
MapReduce实验
一、实验目的 (1)熟悉Hadoop开发包 (2)编写MepReduce程序 (3)调试和运行MepReduce程序 (4)完成上课老师演示的内容 二、实验环境 Windows 10 VMware Workstation Pro虚拟机 Hadoop环境 Jdk1.8 二、实验内容 1.单词计数实验(wordcount) (1)输入start-all.sh启动hadoop相应进程和相关的端口号 (2)打开网站localhost:8088和localhost:50070,查看MapReduce任务启动情况 (3)写wordcount代码并把代码生成jar包 (4)运行命令 (1):把linus下的文件放到hdfs上 (2):运行MapReduce (5):查看运行结果 (6)网页上查看MapReduce任务 2.矩阵相乘实验(matrix) (1)写matrix代码并把代码生成jar包 (2)运行命令 (1):把linus下的文件放到hdfs上 (2):运行MapReduce (3):查看运行结果 3.网页排名实验(pagerank) (1):写pagerank代码并把代码生成jar包
2022-05-25 14:07:37
10.46MB
hadoop
mapreduce
文档资料
大数据
Hadoop
原理与技术
SparkSQL操作实验
一、实验目的 (1)通过实验掌握 Spark SQL 的基本编程方法; (2)熟悉 RDD 到 DataFrame 的转化方法; (3)熟悉利用 Spark SQL 管理来自不同数据源的数据。 (4)java程序实现SparkSQL 二、实验环境 Windows 10 VMware Workstation Pro虚拟机 Hadoop环境 Jdk1.8 三、实验内容 (一)SparkSQL的基本知识 (1)输入start-all.sh启动hadoop相应进程和相关的端口号 (2)启动Spark分布式集群并查看信息 (3)网页端查看集群信息 (4)启动spark-shell控制台 (5)访问http://localhost:4040可以看到spark web界面 (6)进入/spark/examples/src/main/resources目录,查看该目录下的内容 (7)查看people.json和employees.json的内容 (8)读取people.json、employees.json,创建DataFrame
2022-05-25 12:04:48
10.36MB
hadoop
文档资料
大数据
big
Hadoop
原理与技术
Spark Streaming操作实验
一、实验目的 1.理解Spark Streaming的工作流程。 2.理解Spark Streaming的工作原理。 3.学会使用Spark Streaming处理流式数据。 二、实验环境 Windows 10 VMware Workstation Pro虚拟机 Hadoop环境 Jdk1.8 三、实验内容 (一)Spark Streaming处理套接字流 1:编写处理套接字流的java程序代码 2:导入缺失的jar包 3:把java程序导出为jar包 4:start-all.sh,启动所有进程,并查看情况 5:启动Spark分布式集群并查看信息 6:启动9999端口 7:切换到jar包所在路径 8:提交程序到spark集群上运行 9:监测端口内容,每隔10秒钟输出一次,当有内容出现的时候,单词计数输出内容 10:退出监测,Ctrl+Z,但是这样并没有完全退出监测,到http://localhost:8080/里杀死该任务,也可以使用Ctrl+C完全退出 (二)Spark Streaming处理RDD队列流 (三)Spark Streaming处理文件流
2022-05-25 12:04:47
10.27MB
hadoop
spark
文档资料
大数据
Hadoop
原理与技术
Spark操作实验
一、实验目的 1. 理解Spark编程思想; 2. 学会在Spark Shell中编写Scala程序; 3. 学会在Spark Shell中运行Scala程序。 二、实验环境 Windows 10 VMware Workstation Pro虚拟机 Hadoop环境 Jdk1.8 三、实验内容 (一)Spark基础知识 (1)输入start-all.sh启动hadoop相应进程和相关的端口号 (2)启动Spark分布式集群并查看信息 (3)网页端查看集群信息 (4)启动spark-shell控制台 1:local模式启动 2:登录master服务器,在集群模式下启动 (5)访问http://localhost:4040可以看到spark web界面 (6)从本地文件系统中加载数据 (7)从分布式文件系统HDFS中加载数据 (8)可以调用SparkContext的parallelize方法,在Driver中一个已经存在的数组上创建RDD。 (9)可以调用SparkContext的parallelize方法,在Drive (二)spark运行wordcount程序
2022-05-25 12:04:47
6.74MB
hadoop
spark
文档资料
大数据
Hadoop
原理与技术
Linus命令行基本操作
一、实验目的 Hadoop运行在Linux系统上,因此,需要学习实践一些常用的Linux命令。本实验旨在熟悉常用的Linux操作,为顺利开展后续其他实验奠定基础。 二、实验环境 Windows 10 VMware Workstation Pro虚拟机 Hadoop环境 Jdk1.8 三、实验内容 1:Linus常见命令: (1)创建目录:mkdir 文件夹名 (2)建多层次目录:mkdir -p 文件夹名/文件夹名/文件夹名 (3)同层次建多个文件夹:mkdir 文件夹名/文件夹名 文件夹名/文件夹名 文件夹名/文件夹名 (4)切换目录:cd 文件夹名 (5)显示当前目录路径:pwd (6)显示当前目录下的文件或目录:ls (7)创建空文件:touch 文件夹名 (8)编辑文件内容:vi 文件名 (9)容许编辑文件内容:i (10)保存并退出::wq (11)查看文件内容:cat 文件名 (12)删除文件:rm 文件名字 (13)返回上一层目录:cd.. (14)返回根目录:cd (15)删除文件夹:rm -rf 文件夹名 (16)显示文件系统使用情况:du
2022-05-25 09:07:51
2.01MB
hadoop
文档资料
大数据
big
AN108 原理图技术资料-原理图
AN108 原理图技术资料
2022-05-16 10:28:26
48KB
AN108
原理图
技术资料
1
信息安全
原理与技术
.pptx
信息安全
原理与技术
2022-05-11 19:04:59
781KB
文档资料
信息安全原理与技术
大数据
原理与技术
课程实验报告完整版
13.1实验一:熟悉常用的Linux 操作和Hadoop操作 本实验对应第3章的内容。 13.1.1 实验目的 Hadoop运行在 Linux系统上,因此,需要学习实践一些常用的 Linux命令。本实验旨在熟悉常用的 Linux操作和 Hadoop操作,为顺利开展后续其他实验奠定基础。 13.1.2 实验平台 (1)操作系统:Linux(建议Ubuntu 16.04)。(2)Hadoop版本:2.7.1。
2022-05-05 18:06:00
3.29MB
big
data
文档资料
大数据
SSM三大框架的运行流程原理核心技术详解.docx.zip
Spring+SpringMVC+Mybatis SSM三大框架的运行流程、原理、核心技术详解 理解很透彻, 入门五星推荐
2022-04-28 21:52:21
909KB
SSM
Spring
SpringMVC
Mybatis
1
个人信息
点我去登录
购买积分
下载历史
恢复订单
热门下载
基于LSTM模型的股票预测模型_python
新型冠状病毒疫情_2020年东三省数学建模A题_论文展示
华为结构与材料工程师-知识点总结【by詹姆斯申易登】.pdf
token登录器.rar
基于MQ2烟雾传感器的STM32F103程序
matlab时频分析工具箱+安装方法+函数说明+最新版tftb.
西安问题电缆-工程伦理案例分析.zip
simulink仿真实现光伏发电MPPT+能量管理
RNN-LSTM卷积神经网络Matlab实现
适用于eNSP 1.3.00 可加载的USG6000V防火墙设备包
DBSCAN算法Matlab实现
风电场风速及功率数据.zip
华为OD机试真题.pdf
基于hadoop商品推荐系统课程设计
CUDA并行程序设计 GPU编程指南-中文扫描539页完整版pdf+高质量英文完整591页原版非扫描pdf
最新下载
k610d i7d2_原厂BIOS 炫龙A41L 大麦2s等广达盲刷bios
AIR-CT2500-K9-8-5-182-0.aes
AIR-CT2500-AP_BUNDLE-K9-8-5-182-0.aes
铭瑄580 8G 镁光颗粒
第十三届 蓝桥杯 单片机 省赛 代码及proteus仿真 IAP15F2K61S2 和AT89C 51单片机都能用
ECS700工程例子
DW-TX382-1并1串专用驱动.zip
openglDemo基本使用Demo
cat4500e-entservicesk9-mz.122-54.SG1.bin
掌讯SD8227 hw 1.0-sw0-6.6 MCU升级文件
其他资源
PHP留言板模块源码详解
啁啾光纤光栅matlab仿真源程序
南方测绘cass9.1/9.0通用写狗包
Computational Methods for Fluid Dynamics, Joel H. Ferziger.pdf
matlab实现的阶次分析算法,用于变转速机械故障特征提取,可运行,包含寻找脉冲时刻,等角度时刻,数字跟踪滤波,样条差值等步骤
riscv32-unknown-elf-gcc v8.2.0交叉编译工具链,第二部分
利用JPcap实现嗅探器Snifer,以web形式来展示数据,还有数据统计图表
latex从入门到精通.pdf
STM32CubeF4固件包STM32Cube_FW_F4_V1.22.0
DCT域图像数字水印算法的分析和实现源代码
酷欧天气(2018最新版)
sql2000学生管理数据库
中联泵的智能选型软件
gugeliulanqi.zip
winform已写好的程序支持多语言
Office Online Server WOPI 源代码
Centos 7安装配置Hadoop生态圈CDH5版本
OFDM同步算法中的最大似然函数法
手机端浏览pdf的demo
Freescale 飞思卡尔 各模块程序范例
php_memcache-3.0.9 for php7-nts-vc14-x86 扩展DL