上传者: 38720322
|
上传时间: 2022-07-04 15:55:51
|
文件大小: 94KB
|
文件类型: PDF
大数据时代:
数据量大
数据种类繁多
数据增长速度快
大数据不同层面及技术:
大数据关键技术:
分布式存储
GFS/HDFS
BigTable/HBase
NoSQL(键值、列族、图形、文档数据库)
NewSQL(如 : SQL Azure )
分布式处理框架:
Hadoop
Storm
Flink
Spark
hadoop:
hadoop是Apache软件基金会旗下的一个开源式计算平台为用户提供了系统底层细节透明的分布式基础架构
Hadoop是java编写的开源、可伸缩和容错的框架,并且可部署在廉价的计算机集群中
hadoop以分布式文件系统HDFS和MapReduce为核心进行海量数据的