本书是您纵情享用数据之美的得力助手 作为处理海量数据集的理想工具 Apache Hadoop架构是MapReduce算法的一种开源应用 是Google 谷歌 开创其帝国的重要基石 本书内容丰富 展示了如何使用Hadoop构建可靠 可伸缩的分布式系统 程序员可从中探索如何分析海量数据集 管理员可以了解如何建立与运行Hadoop集群 本书完全通过案例学习来展示如何用Hadoop解决特殊问题 它将帮助您: 使用Hadoop分布式文件系统(HDFS)来存储海量数据集 通过MapReduce对这些数据集运行分布式计算 熟悉Hadoop的数据和I O构件 用于压缩 数据集成 序列化和持久处理 洞悉编写MapReduce实际应用程序时常见陷阱和高级特性 设计 构建和管理专用的Hadoop集群或在云上运行Hadoop 使用Pig这种高级的查询语言来处理大规模数据 利用HBase这个Hadoop数据库来处理结构化和半结构化数据 学习Zookeeper 这是一个用于构建分布式系统的协作原语工具箱 如果您拥有海量数据 无论是GB级还是PB级 Hadoop都是完美的选择 本书是这方面最全面的参考 ">本书是您纵情享用数据之美的得力助手 作为处理海量数据集的理想工具 Apache Hadoop架构是MapReduce算法的一种开源应用 是Google 谷歌 开创其帝国的重要基石 本书内容丰富 展示了如何使用Hadoop构建可靠 可伸缩的分布式系统 [更多]
2015-01-02 00:00:00 30.71MB hadoop 指南
1
第1章 初识Hadoop 第2章 MapReduce简介 第3章 Hadoop分布式文件系统 第4章 Hadoop的I/O 第5章 MapReduce应用开发 第6章 MapReduce的工作原理 第7章 MapReduce的类型与格式 第8章 MapReduce特性 第9章 Hadoop集群的安装 第10章 Hadoop的管理 第11章 Pig简介 第12章 Hbase简介 第13章 ZooKeeper简介 第14章 案例研究 附录A Apache Hadoop的安装 附录B Cloudera的Hadoop分发包 附录C 预备NCDC气象资料
2014-06-16 00:00:00 23.38MB Hadoop 权威指南
1
学习javascript的人必须要看的书,里面包含源代码和中文版的pdf电子书
2013-01-07 00:00:00 20.67MB javascript
1