概念
MapReduce是hadoop分布式计算框架。
MapReduce意味着在计算过程中实际分为两大步,Map过程和Reduce过程。
下面以一个统计单词次数简单案例为例:
数据源
Map类
import java.io.IOException;
import org.apache.hadoop.io.LongWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Mapper;
// 案例:统计每一个单词出现的次数
// KEYIN - 这一行的偏移量 ---
// VALUEIN
2022-06-03 10:18:20
214KB
c
ce
do
1