个人使用笔记,写的非常潦草,非常菜,不好,别下谢谢
2022-09-20 19:07:30 514KB hadoop
1
DOE大型离线数仓与用户画像系统,2022年8月底完结新课,提供课程配套的源码+文档+虚拟机下载! 带领学员从零搭建一个完整的大数据数仓系统; 涵盖数据采集,数据ETL,数仓分层开发,报表开发,OLAP查询全流程; 涵盖元数据管理,数据质量管理,数据建模方法论等数据治理实战内容; 包含行为日志数据域,业务数据域的全域数据处理实战。
2022-09-13 19:05:48 578B DOE 离线数仓 用户画像系统
1
分享离线数仓课程——《DOE大型离线数仓与用户画像系统》,2022年8月完结新课,一共19天的课程,提供课程配套的源码+文档下载!! DOE大型离线数仓与用户画像系统课程将带领大家从零搭建一个完整的大数据数仓系统 DOE大型离线数仓与用户画像系统课程涵盖数据采集,数据ETL,数仓分层开发,报表开发,OLAP查询全流程; 涵盖元数据管理,数据质量管理,数据建模方法论等数据治理实战内容; 包含行为日志数据域,业务数据域的全域数据处理实战; 很多大数据技术学员,都通过本项目课程成功拿到入行的高起点offer!
2022-09-09 19:05:24 745B 数仓 用户画像 大数据
1
DOE大型离线数仓与用户画像系统课程分享2022,一共19天视频,提供源码和文档下载
2022-09-09 19:05:23 188B 数据仓库 用户画像 flink 大数据
1
课程分享——DOE大型离线数仓与用户画像系统,2022年8月底完结新课,提供课程配套的源码+文档+虚拟机下载! 带领学员从零搭建一个完整的大数据数仓系统; 涵盖数据采集,数据ETL,数仓分层开发,报表开发,OLAP查询全流程; 涵盖元数据管理,数据质量管理,数据建模方法论等数据治理实战内容; 包含行为日志数据域,业务数据域的全域数据处理实战; 很多大数据技术学员,都通过本项目课程成功拿到入行的高起点offer。
2022-09-08 18:07:14 636B flink 数据仓库 用户画像 DOE
1
封装 ClickHouse 工具类和方法 相关依赖 ru.yandex.clickhouse clickhouse-jdbc 0.3.0 com.fasterxml.jackson.core jackson-databind com.fasterxml.jackson.core jackson-core
2022-08-31 09:06:27 2KB flink
1
适合自学大数据,文档详细,涉及到Oracle数据库SQL plsql. Linux系统常用命令 大数据:hadoop hive shell脚本 大数据搬运工具:sqoop ,ketlle. 调度工具:azkaban, 可视化软件使用:帆软 数据仓库设计理论,数仓建模,三范式等;
2022-08-28 09:03:43 10.11MB 数据库 Oracle Hadoop Linux
1
本次分享主要从三个方面介绍京东流量场下的数据处理方案,同时也会结合京东实际场景案例,介绍京东在流量场下的一些数据应用和实践。 全文会围绕以下三方面内容展开: 京东零售流量数仓架构 京东零售场景的数据处理 数据处理架构未来探索 1. 京东零售——流量简介 ① 什么是流量? 简单来说,流量就是用户作用在京东页面上,产生一系列行为数据的集合。 ② 流量数据的来源 数据来源主要是移动端和PC端,以及线下店、外部采买、合作商的数据等。 这些数据是如何流转到数仓的呢? 2. 京东零售——流量数据处理架构 由架构图可以看出,对不同的终端采取不同的采集模式;例如,对APP原生页面采取SDK的采集模式,对于PC、H5页面是JS采集,数据采集后按照实时和离线双写,离线直接写到CFS分布式文件系统中,每小时从CFS拉取数据文件,同时对数据文件大小、采集ip进行监控,防止数据丢失;实时是以白名单的方式动态配置,写到kafka中,最后将数据入仓。
2022-08-23 18:09:01 1.15MB 京东 零售 流量 数仓
1