上传者: 43934844
|
上传时间: 2022-06-21 22:03:49
|
文件大小: 3.53MB
|
文件类型: PPTX
大数据平台介绍 大数据 二零一五年七月 大数据平台介绍全文共43页,当前为第1页。 1 2 目录 Hadoop大数据生态圈介绍 大数据应用介绍 3 Cloudera Manager介绍 大数据平台介绍全文共43页,当前为第2页。 Hadoop大数据生态圈 大数据平台介绍全文共43页,当前为第3页。 Hadoop生态圈 大数据平台介绍全文共43页,当前为第4页。 Hadoop简介 Hadoop一个分布式系统基础架构,由Apache基金会开发。用户可以在不了解分布式底层细节的情况下,开发分布式程序。充分利用集群的威力高速运算和存储 。简单地说来,Hadoop是一个可以更容易开发和运行处理大规模数据的软件平台。 Hadoop的框架最核心的设计就是:HDFS和MapReduce。HDFS为海量的数据提供了存储,则MapReduce为海量的数据提供了计算。 大数据平台介绍全文共43页,当前为第5页。 Hadoop能解决哪些问题 海量数据需要及时分析和处理。 海量数据需要深入分析和挖掘。 数据需要长期保存 问题: 磁盘IO成为一种瓶颈,而非CPU资源。 网络带宽是一种稀缺资源 硬件故障成为影响稳