前 言 大数据学习路线 大数据技术栈思维导图 大数据常用软件安装指南 一、Hadoop 分布式文件存储系统:HDFS 分布式计算框架:MapReduce 集群资源管理器:YARN 单机伪集群环境搭建 集群环境搭建 常用 Shell 命令 Java API 的使用 基于 Zookeeper 搭建 Hadoop 高可用集群 二、Hive 简介及核心概念 Linux 环境下 Hive 的安装部署 CLI 和 Beeline 命令行的基本使用 常用 DDL 操作 分区表和分桶表 视图和索引 常用 DML 操作 数据查询详解 三、Spark Spark Core Spark SQL Spark Streaming 五、Flink 核心概念综述 开发环境搭建 Data Source Data Transformation Data Sink 窗口模型 状态管理与检查点机制 Standalone 集群部署 六、HBase 简介 系统架构及数据结构 基本环境搭建 集群环境搭建 常用 Shell 命令 Java API 过滤器详解 可显示字数有限,详细内容请看资源。
2023-12-20 09:06:41 20.75MB kafka kafka zookeeper zookeeper
1
big data hive spark
2022-08-17 14:05:37 31.58MB spark hive hdfs
1
apache-hive-3.1.3-bin.tar.gz apache-zookeeper-3.5.10-bin.tar.gz hadoop-3.3.3.tar.gz spark-3.2.1-bin-hadoop3.2.tgz mysql-8.0.29-1.el8.x86_64.rpm-bundle
2022-06-17 22:05:55 581.01MB hive spark zk
1
lg大数据高薪训练营 HBase、 Java9 、Java10 、MySQL优化 、JVM原理 、JUC多线程、 CDH版Hadoop Impala、 Flume 、Sqoop、 Azkaban、 Oozie、 HUE、 Kettle、 Kylin 、Spark 、Mllib机器学习、 Flink、 Python、 SpringBoot、 Hadoop3.x新特性、 ClickHouse、 Kudu、 Presto 、Druid、 Ambari 、DataX、 Logstash 、Kibanna、 数据结构 Scala · Scala基础入门 · 函数式编程 · 数据结构 · 面向对象编程 · 模式匹配 · 高阶函数 · 特质 · 注解&类型参数 · 隐式转换 · 高级类型 · 案例实操 Spark Core · 安装部署 · RDD概述 · 编程模型 · 持久化&检查点机制 · DAG · 算子详解 · RDD编程进阶 · 累加器&广播变量 Spark SQL · SparkSQL · DataFrame · DataSet · 自定义
2022-06-08 19:10:43 161B 大数据
1
spark-3.2.0-bin-hadoop3-without-hive
2022-06-06 13:22:41 173.18MB hive spark hadoop 数据仓库
1
CDH6针对hive on spark的调优文档,这个是生产的实战经验
2022-05-25 14:07:36 539KB hive spark 文档资料 hadoop
1
使用hive3.1.2和spark3.0.0配置hive on spark的时候,发现官方下载的hive3.1.2和spark3.0.0不兼容,hive3.1.2对应的版本是spark2.3.0,而spark3.0.0对应的hadoop版本是hadoop2.6或hadoop2.7。 所以,如果想要使用高版本的hive和hadoop,我们要重新编译hive,兼容spark3.0.0。除了兼容spark3.0.0外,还将hive3.1.2的guava的版本进行了提升,和hadoop3.x保持一致,以便兼容hadoop3.1.3。
2022-05-20 14:06:07 268.02MB 源码软件 hive spark hadoop
1
hadoop、hive、spark
2022-04-19 18:09:57 1.78MB hive hadoop spark linux
1
删除了删除了删除了删除了删除了删除了删除了删除了删除了删除了
2022-04-04 18:36:20 116B hadoop hive spark 大数据
1
启动大数据框架常用命令
2022-01-25 09:13:14 8KB hive kafka big data
1