上传者: 36428822
|
上传时间: 2022-06-20 18:07:49
|
文件大小: 1.28MB
|
文件类型: DOCX
林子雨大数据原理与技术第三版实验5实验报告
大数据技术与原理实验报告
MapReduce 初级编程实践 姓名:
实验环境:
操作系统:Linux(建议Ubuntu16.04);
Hadoop版本:3.2.2;
实验内容与完成情况:
(一)编程实现文件合并和去重操作
对于两个输入文件,即文件 A 和文件 B,请编写 MapReduce 程序,对两个文件进行合并,
并剔除其中重复的内容,得到一个新的输出文件 C。下面是输入文件和输出文件的一个样例 供参考。
输入文件 A 的样例如下: