上传者: 38517212
|
上传时间: 2022-06-03 10:18:20
|
文件大小: 214KB
|
文件类型: PDF
概念
MapReduce是hadoop分布式计算框架。
MapReduce意味着在计算过程中实际分为两大步,Map过程和Reduce过程。
下面以一个统计单词次数简单案例为例:
数据源
Map类
import java.io.IOException;
import org.apache.hadoop.io.LongWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Mapper;
// 案例:统计每一个单词出现的次数
// KEYIN - 这一行的偏移量 ---
// VALUEIN