基于Hadoop的全国酒店数据清洗项目源码+报告.zip结合本案例背景介绍,说明对本数据集进行分析的目的,说明采用的分析技术,实现的价值。
本案采用的数据集是全国各省市酒店的运营情况数据集,对该数据集进行分析的目的是为了更好的指导酒店行业的发展。本案例使用hdfs分布式存储系统存储数据,利用Hadoop的MapReduce技术进行数据分析。
3、简要介绍mapreduce框架
MapReduce是面向大数据并行处理的计算模型、框架和平台,它隐含了以下三层含义:
(1)MapReduce是一个基于集群的高性能并行计算平台(Cluster Infrastructure)。它允许用市场上普通的商用服务器构成一个包含数十、数百至数千个节点的分布和并行计算集群。
基于Hadoop的全国酒店数据清洗项目源码+报告.zip基于Hadoop的全国酒店数据清洗项目源码+报告.zip基于Hadoop的全国酒店数据清洗项目源码+报告.zip基于Hadoop的全国酒店数据清洗项目源码+报告.zip基于Hadoop的全国酒店数据清洗项目源码+报告.zip