hadoop,spark,hive.....
2022-04-06 02:48:19 5.62MB hive hadoop spark big
1
hive思维导图全领域
2022-04-06 01:03:46 12.1MB hive big data 大数据
1
多易教育_HIVE文档(1).docx
2022-04-05 22:59:57 7.39MB
1
删除了删除了删除了删除了删除了删除了删除了删除了删除了删除了
2022-04-04 18:36:20 116B hadoop hive spark 大数据
1
Spark Hive UDF示例 建立项目 mvn clean package 将spark-hive-udf-1.0.0-SNAPSHOT.jar复制到边缘节点临时目录 spark-hive-udf]# cp target/spark-hive-udf-1.0.0-SNAPSHOT.jar /tmp 通过提供罐子来启动火花壳 spark-shell --master yarn --jars /tmp/spark-hive-udf-1.0.0-SNAPSHOT.jar 创建名称为大写的函数并列出该函数 spark.sql("CREATE OR REPLACE FUNCTION uppercase AS 'com.ranga.spark.hive.udf.UpperCaseUDF' USING JAR '/tmp/spark-hive-udf-1.0.0-SNAPSHOT.jar'") sp
2022-03-30 20:00:16 5KB Java
1
java sql笔试题示例 Hive UDF 项目 介绍 该项目只是一个示例,包含多个 (UDF),用于 Apache Spark。 它旨在演示如何在 Scala 或 Java 中构建 Hive UDF 并在 . 为什么要使用 Hive UDF? Hive UDF 的一个特别好的用途是与 Python 和 DataFrames 一起使用。 用 Python 编写的原生 Spark UDF 很慢,因为它们必须在 Python 进程中执行,而不是基于 JVM 的 Spark Executor。 要让 Spark Executor 运行 Python UDF,它必须: 将数据从分区发送到与 Executor 关联的 Python 进程,以及 等待 Python 进程反序列化数据,在其上运行 UDF,重新序列化数据,然后将其发回。 相比之下,一个 Hive UDF,无论是用 Scala 还是 Java 编写的,都可以在 Executor JVM 中执行,即使 DataFrame 逻辑是在 Python 中。 实际上只有一个缺点:必须通过 SQL 调用 Hive UDF。 您不能将其作为来自 D
2022-03-30 19:58:46 1.01MB 系统开源
1
当前,所有应用到大数据的公司都需要建设企业数据仓库,以服务于数据分析和为企业决策、产品优化、产品运营等提供稳定可靠的数据支持,因此,数据仓库的建设在公司数据的E(抽取)、T(转化)、L(加载)流程中起到至关重要的地位。 本项目将数仓分为三层,分别是ODS层(贴源层)、DW层(数仓层)和APP层(应用层),其中DW层中包含事实层、维度层、宽表层,为了达到拿空间换时间的目的,由事实层中的事实表和维度层的维度表关联形成宽表层。
2022-03-28 14:31:42 5.78MB hadoop hive  数仓框架
1
新手学习大数据搭建环境所需要安装资料包,其中包括hive-mysql安装包,HIVE连接mysql驱动。其中包括 apache-hive-1.2.1-bin.tar.gz MySQL-client-5.6.24-1.el6.x86_64.rpm mysql-connector-java-5.1.27.tar.gz MySQL-server-5.6.24-1.el6.x86_64.rpm
2022-03-25 21:43:21 162.74MB hive mysql linux hadoop
1
Hive JDBC连接示例 该项目展示了如何使用各种不同的方法连接到Hiveserver2。 所有类仅适用于Hiveserver2。 正在使用Cloudera JDBC驱动程序,可以从下载。 在撰写本文时,最新版本为v2.5.15 。 要求: 您需要下载驱动程序并将其复制到lib文件夹。 从下载zip,以获取正确的操作系统和体系结构。 解压缩并转到Cloudera_HiveJDBC41_xxx文件夹。 将所有罐子从那里复制到lib文件夹。 JDBC API v3.x支持JRE v4.0或v5.0 JDBC API v4.x支持JRE v6.0或更高版本 JDBC API v4.1.x支持JRE v7.0或更高版本 适用于Apache Hive的Cloudera JDBC驱动程序支持Hive 0.11、0.12、0.13、0.14、1.0和1.1。 有关更多信息,请参阅下载的z
1
1. Kerberos是一种计算机网络授权协议,用来在非安全网络中,对个人通信以安全的手段进行身份认证。具体请查阅官网 2. 需要安装的包(基于centos) yum install libsasl2-dev yum install gcc-c++ python-devel.x86_64 cyrus-sasl-devel.x86_64 yum install python-devel yum install krb5-devel yum install python-krbV pip install krbcontext==0.9 pip install thrift==0.9.3 pip
2022-03-24 15:40:25 60KB df dfs fs
1