水果计数
通过MapReduce程序从输入文件计算“苹果”,“香蕉”和“葡萄”的出现频率。
地图缩小
MapReduce是一种编程模型和相关的实现,用于在集群上使用并行的分布式算法来处理和生成大数据集。 一个MapReduce程序包括:
映射过程:执行过滤和排序。
减少方法:执行摘要操作。
驱动程序类驱动程序类是控制程序执行的主要类。 在这里,我们创建一个Job对象,并设置程序中使用的驱动程序,映射程序和reducer类。
Mapper类MapReduce程序的任何mapper类都可以扩展抽象Mapper类。 然后,我们必须重写map函数,该函数采用键值对并引用Context变量,该变量由reduce函数处理。
Reducer类MapReduce程序的Reducer类扩展了抽象类Reducer。 该方法将在此类中重写。
1