快手 EB 级 HDFS 挑战与实践 贝壳基于 Druid 的 OLAP 引擎应用实践 Hive MetaStore 在快手遇到的挑战与优化 转变,贝壳数据平台的演进 快手超大规模集群调度优化实践 有赞数据治理之提质降本 Impala 3.4 在网易的最新实践 美团酒旅数据治理实践 Impala 3.4 在网易的最新实践 取代 HDFS?Ozone 在腾讯的最新研究进展 金融资管数据中台体系探索实践 贝壳 DMP 平台建设实践 美团配送实时特征平台建设实践 商业 DMP 数据管理平台的架构与实践 微博基于 Flink 的机器学习实践 柔性多模正则匹配引擎 京东 Flink 优化与技术实践 京东实时数据仓库开发实践 Kafka 在车好多的最佳实践 ClickHouse 在手淘流量分析业务实践 优酷大数据 OLAP 技术选型 k DataFunTalk 成就百万数据科学家! 58 商业数仓建设实践 菜鸟实时数仓 2.0 进阶之路 美团外卖流量数据的采集加工和应用 滴滴 Elasticsearch 集群跨版本升级与平台重构之路 Flink1.11+Hive 批流一体数仓 美团外卖实时数仓建
2022-08-01 09:06:26 53.54MB 大数据
1
大数据处理R语言
2022-07-31 20:34:02 5.66MB 大数据 R语言
1
data/students.txt 学生信息表
2022-07-31 18:04:48 40KB 大数据
1
data/score.txt 学生分数表
2022-07-31 18:04:47 129KB 大数据
1
data/subject.txt 学生科目表
2022-07-31 18:04:46 170B 大数据
1
文件共有七部分组成,分别是spark、hive、Hbase、flink、zookeeper、Hadoop、kafka。包含了各部分组件的基础概念,寻常提问方向,通过大量前人实际总结归纳整理。从理论基础开始,拥抱大数据。
2022-07-31 09:05:48 4.73MB spark hadoop flink hive
1
Hadoop、Spark大数据入门、进阶电子书大全-附件资源
2022-07-30 22:02:48 23B
1
centos 下hive连接mysql驱动 ,mysql-connector-java-8.0.26-1.el7.noarch. 使用方法: 1.下载本rpm文件后,上传至你的服务器(虚拟机) 2. rpm -ivh mysql-connector-java-8.0.26-1.el7.noarch进行安装 3.安装完成后会在 /usr/share/java下会有mysql-connector-java.jar 4.按你的实际需求,将此mysql-connector-java.jar文件复制到你需要的地方,一班是在大数据组件的conf目录,比如hive是/usr/software/hive312/lib/
2022-07-30 09:07:18 2.31MB hive mysql 大数据 数据仓库
1
可作为java大数据课程设计使用: 详情查看:https://blog.csdn.net/weixin_46115961/article/details/126061076
1
2021年安徽省大数据现场赛赛题 包括: 1.平台搭建 2.大数据预处理 3.大数据分析 4.数据可视化 5.综合题 以及所需的数据集 可通过训练往年赛题来巩固所学的大数据相关知识,进一步为以后的比赛做基础 例如: .销售额与新零售智能销售设备数量的关系(按月)(7分) 探索近6个月销售额和新零售智能销售设备数量之间的关系,并按时间走势进行可视化分析。要求:销售额和设备数量进行双折线图画图展示。其中横坐标为月份,左侧纵坐标为销售额(元),右侧纵坐标为设备数量(台)。 要求: 1) 销售额折线图(2分) 2) 设备数量折线图(2分) 3) 两个折线不同的坐标(1分) 4) 中文显示 (1分) 结果截图: 从图中可以得出的结论描述:(1分) 代码: 2.用户个体消费分析(8分) 2.1、查找近6个月销售额后10的商品,从而找出滞销商品,并对其销售金额进行可视化分析。 4分 销售金额作为X轴,商品名称做Y轴 要求: 1)X轴是销售金额,Y轴是商品名称(1分) 2)画出条形图(2分) 3)中文显示(1分) 结果截图: 代码:
1