java使用JDBC连接Hadoop的hive数据库所用jar包,JDBC连接hive具体实现查看https://editor.csdn.net/md/?articleId=103372571
2022-05-30 20:39:50 33.22MB JDBC hive Hadoop jar
1
hive自定义函数demo
2022-05-30 14:05:56 98KB hive 源码软件 hadoop 数据仓库
1
hive JDBC jar包全家桶。由于项目使用,此jar包从国外下载费了好大劲,现分享给大家。 cdh6.3.2版本的
2022-05-29 14:20:17 117.72MB hive-jdbc cdh6.3.2
1
apache-hive的安装与配置
2022-05-29 14:05:57 892.33MB hive apache 综合资源 hadoop
1
虽然 Hive 的官方给我们提供了连接 Hive 的客户端, 但是在实际的开发环境中我们一般 不使用它, 因为页面太丑, 智能化程度太低, 在这里介绍一款 Hive 的第三方可视化客户端 ——DataGrip。 DataGrip 页面美观大方, 操作简洁, SQL 编辑环境优雅, 可在 Windows 平台运行。 是一款通过 JDBC 连接 HiveServer2 的图形界面工具(JDBC 就是 Java 数据库连接,说白了就是用 Java 语言来操作数据库)。 简单介绍一下 DataGrip: 由 JetBrains 公司推出的数据库管理软件, 几乎支持所有主流 的关系数据库产品, 如 DB2、 Derby、 MySQL、 Oracle、 SQL Server 等, 也几乎支持所有主流的大数据生态 SQL 软件, 且界面简单易用。
2022-05-27 09:08:40 1.05MB DataGrip  Hive  大数据技术 Hadoop 
1
项目Steam游戏推荐系统 1概述 关键字:推荐系统,协作过滤,Spark,Hive,Flask,Web爬网程序,AWS EC2,AWS RDS 1.1引言 推荐系统在最近几年变得越来越流行,并且广泛用于电影,音乐,新闻,书籍,研究文章,搜索查询,社交标签和产品等各个领域。 推荐系统或推荐系统是信息过滤系统的子类,其试图预测用户将给予商品的“等级”或“偏好”。 在这个项目中,我通过Spark的ALS(交替最小二乘)API(pyspark.mllib.recommendation.ALS)在Spark上使用协作过滤算法,实现了游戏推荐系统。 协作过滤方法是基于收集和分析有关用户的行为,活动或偏好的大量信息,并基于与其他用户的相似性来预测用户的喜好。 1.2架构 整个项目分为三个阶段: 通过Web爬网程序收集数据 Spark上的游戏推荐引擎 Web UI实施 该项目的体系结构如下所示:
2022-05-27 01:11:18 9.52MB 系统开源
1
hive面试题,Hive高频面试题
2022-05-26 13:03:14 152KB hive 综合资源 hadoop 数据仓库
1
一、实验目的 上机实操,学会使用Hive开发。 二、实验环境 Windows 10 VMware Workstation Pro虚拟机 Hadoop环境 Jdk1.8 三、实验内容 1:创建内部表 (1):start-all.sh,启动Hadoop所有进程 (2):初始化元数据库生成metastore (3):启动hive (4):把linus上面的rg.txt放到hdfs下 (5):show databases;显示所有数据库 (6):新建数据库test (7):创建数据库表rg (8):给表导入数据 (9):查看数据 (10):查看hdfs下文件的变化 (11):drop table rg;删除表 (12):查看hdfs下文件的变化 2:创建外部表 (1):在hdfs上建rg文件夹,并把数据放文件夹下 (2):创建数据库表 (3):查看hdfs下文件的变化 (4):select * from rg_ext;查找数据 (5):drop table rg_ext;删除表 三、创建分区表 四、创建分桶表 五、java连接数据库窗口版 六、java连接数据库代码版
2022-05-25 14:07:44 9.81MB hadoop hdfs 文档资料 大数据
hive监控巡检优化文档
2022-05-25 14:07:43 145KB hive 文档资料 hadoop 数据仓库
1
CDH6针对hive on spark的调优文档,这个是生产的实战经验
2022-05-25 14:07:36 539KB hive spark 文档资料 hadoop
1