见面会 搜索数据集: : MovieLens: :
2021-11-11 10:22:16 1.5MB Python
1
一、Hive简介 1.什么是Hive Hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供类SQL查询功能(HQL); 其本质是将SQL转换为MapReduce的任务进行运算,底层由HDFS来提供数据的存储,hive可以理解为一个将SQL转换为MapReduce的任务的工具 2.Hive的特点 可扩展 Hive可以自由的扩展集群的规模,一般情况下不需要重启服务 延展性 Hive支持用户自定义函数,用户可以根据自己的需求来实现自己的函数 容错 良好的容错性,节点出现问题SQL仍可完成执行 3.Hive与传统数据库的对比图 4.Hiv
2021-11-10 15:39:31 153KB do hadoop hive
1
使用kettle抽取hive中的数据时,遇到了取数结果乱码的问题。替换此包可以解决
2021-11-10 14:49:46 159KB kettle hive 数据乱码
1
适用于hive-1.2.1与hbase-1.3.1版本适配。用于打通hbase与hive之间的屏障,避免重新编译jar包所带来的麻烦。
2021-11-10 11:40:40 104KB hive 大数据
1
hive入门
2021-11-10 11:28:33 741KB hive
1
Impala 3.2.0-cdh6.2.0 驱动文件,Hive 2.1.1-cdh6.2.0 驱动文件,已经在FineReport V10.0上做过测试
2021-11-10 10:51:29 15.3MB impala cdh 6.2.0 hive
1
一个WordCount执行过程的实例 Map过程示意图
2021-11-08 20:01:02 3.06MB Hadoop Hive Spark Hbase
1
Hive.sql
2021-11-04 09:59:25 46KB hive
1
jdbc连接hive代码所需要jar包,测试有效
2021-11-03 09:25:02 5.52MB hive,jdbc
1
hadoop总结.md
2021-11-02 20:01:15 33KB hadoop hbase hive flume
1