上传者: suwei825
|
上传时间: 2021-04-16 17:03:51
|
文件大小: 267.93MB
|
文件类型: GZ
Hive是一个基于Hadoop的数据仓库工具,它本身并不存储数据,部署在Hadoop集群上,数据是存储在HDFS上的.
Hive所建的表在HDFS上对应的是一个文件夹,表的内容对应的是一个文件。它不仅可以存储大量的数据而且可以对存储的数据进行分析,但它有个缺点就是不能实时的更新数据,无法直接修改和删除数据,如果想要修改数据需要先把数据所在的文件下载下来,修改完之后再上传上去。
Hive也不是分布式计算框架,Hive的核心工作就是把sql语句翻译成MR程序去执行,不用我们再手动去写MapReduce了。
Hive也不提供资源调度系统,默认由Hadoop集群中的YARN集群来调度。
Hive可以将结构化的数据映射为一张数据库表,并提供HQL(HiveSQL)查询功能。