上传者: 43934844
|
上传时间: 2022-06-16 18:03:12
|
文件大小: 603KB
|
文件类型: DOC
概述 随着海量数据问题的出现,海量管理能力,多类型,变化快,高可用性,低成本,高 端可扩展性等需求给企业数据战略带来了巨大的挑战。企业数据仓库、数据中心的技术 选型变得尤其重要!所以在选型之前,有必要对目前市场上各种大数据量的解决方案进 行分析。 主流分布式并行处理数据库产品介绍 1 Greenplum 1 基础架构 Greenplum是基于Hadoop的一款分布式数据库产品,在处理海量数据方面相比传统数 据库有着较大的优势。 Greenplum整体架构如下图: 数据库由Master Severs和Segment Severs通过Interconnect互联组成。 Master主机负责:建立与客户端的连接和管理;SQL的解析并形成执行计划;执行计 划向Segment的分发收集Segment的执行结果;Master不存储业务数据,只存储数据字典 。 Segment主机负责:业务数据的存储和存取;用户查询SQL的执行。 2 主要特性 Greenplum整体有如下技术特点: Shared-nothing架构 海量数据库采用最易于扩展的Shared- nothing架构,每个节点都有自己的操作