本次分享主要从三个方面介绍京东流量场下的数据处理方案,同时也会结合京东实际场景案例,介绍京东在流量场下的一些数据应用和实践。 全文会围绕以下三方面内容展开: 京东零售流量数仓架构 京东零售场景的数据处理 数据处理架构未来探索 1. 京东零售——流量简介 ① 什么是流量? 简单来说,流量就是用户作用在京东页面上,产生一系列行为数据的集合。 ② 流量数据的来源 数据来源主要是移动端和PC端,以及线下店、外部采买、合作商的数据等。 这些数据是如何流转到数仓的呢? 2. 京东零售——流量数据处理架构 由架构图可以看出,对不同的终端采取不同的采集模式;例如,对APP原生页面采取SDK的采集模式,对于PC、H5页面是JS采集,数据采集后按照实时和离线双写,离线直接写到CFS分布式文件系统中,每小时从CFS拉取数据文件,同时对数据文件大小、采集ip进行监控,防止数据丢失;实时是以白名单的方式动态配置,写到kafka中,最后将数据入仓。
2022-08-23 18:09:01 1.15MB 京东 零售 流量 数仓
1
【Java分享客栈】一文搞定京东零售开源的AsyncTool,彻底解决异步编排问题。.doc
2022-07-12 09:07:25 798KB 技术资料
京东流量场下的数据处理方案,同时也会结合京东实际场景案例,介绍京东在流量场下的一些数据应用和实践。 全文会围绕以下三方面内容展开: 京东零售流量数仓架构 京东零售场景的数据处理 数据处理架构未来探索 京东零售——流量挑战 首先是数据爆炸式的增长。2015年至今,整体的数据量翻了约十几倍,但资源情况并没有相应成比例的增长。其次,业务的复杂度升高,包括新增了小程序、开普勒、线下店的一些数据以及并购的企业的数据等,因此整体的数据格式以及完备度上还是存在较大差异的。再次,随着业务发展,流量精细化运营的场景增多,但数据服务的时效并没有较大变化,需要我们在有限时间内处理一些更多更大体量的数据,以满足更多场景化应用。特别是京东刷岗这样的场景,对数据的范围、需要处理的数据量,以及数据时效都是一个比较大的挑战。
2022-07-05 14:07:13 1.15MB 京东 日志数据 数据处理 京东零售
1
京东零售数据仓库演进之路.pdf
2022-05-28 11:05:23 12.04MB 数据库技术 IOTE
2021京东零售数据智能实践探索沙龙PPT汇总,共11份。 01 京东零售OLAP平台建设和场景实践 02 OLAP技术在数据产品中的应用 03 Flink在京东广告计费系统的应用 04 京东客服全链路数智化应用实践 05 京东智能商客之推荐卖点的技术介绍 06 基于强化学习的电商搜索排序算法 07 挖掘客户意见 驱动经营改善 08 深度学习下的京东搜索召回技术 09 京东推荐算法精排技术实践 10 京东零售数据算法通道委员会-电商商品文案挖掘难点与优化实践 11 DataFun-京东AR试妆与AR试鞋技术探秘
2021-10-26 18:07:58 81.08MB 零售数据智能实践探索 2021