hadoop-3.3.4源码包
2023-01-05 17:26:35 33.98MB hadoop 大数据 3.3.4
1
windows版hadoop3.3.0
2023-01-05 17:26:35 512.55MB hadoop3.3.0
1
《Spark+ClickHouse实战企业级数据仓库,进军大厂必备》,2023年1月最新升级版21章全
2023-01-05 17:26:34 210B Spark+ClickHouse ClickHouse
1
基于hadoop平台hive数据库的taptap游戏平台大数据分析项目源码.zip 已获导师指导并通过的高分项目,下载即用,无需修改。 基于hadoop平台hive数据库的taptap游戏平台大数据分析项目源码.zip 已获导师指导并通过的高分项目,下载即用,无需修改。基于hadoop平台hive数据库的taptap游戏平台大数据分析项目源码.zip 已获导师指导并通过的高分项目,下载即用,无需修改。基于hadoop平台hive数据库的taptap游戏平台大数据分析项目源码.zip 已获导师指导并通过的高分项目,下载即用,无需修改。基于hadoop平台hive数据库的taptap游戏平台大数据分析项目源码.zip 已获导师指导并通过的高分项目,下载即用,无需修改。基于hadoop平台hive数据库的taptap游戏平台大数据分析项目源码.zip 已获导师指导并通过的高分项目,下载即用,无需修改。基于hadoop平台hive数据库的taptap游戏平台大数据分析项目源码.zip 已获导师指导并通过的高分项目,下载即用,无需修改。基于hadoop平台hive数据库的taptap游戏平
基于Hadoop的hive数据库的网站流量日志数据分析系统项目源码.zip 已获导师指导并通过的高分项目。下载即用,内附说明。项目背景 1、项目名 “网站流量日志数据分析系统” 2、概念 a、点击流 点击流(Click Stream)是指用户在网站上持续访问的轨迹,形成点击事件,它会记录用户浏览站点的整个过程。 image-20211123085322048 二、日志数据的数据格式 image-20211123090020444 页面点击流数据 image-20211123091013446 点击流模型Visits表 image-20211123091120698 三、骨灰级指标 1、IP 1天之内,不重复的ip数,统计ip数 2、PV 页面加载的总次数 3、UV 1天之内,访问网站的不重复用户数(以浏览器cookie为依据),一天内同一访客多次访问网站只被计算1次。 四、整体技术架构流程 1、数据采集 2、数据预处理 3、数据入库 4、数据分析 5、数据展示 image-20211201143716799 image-20211123114258257 五、技术分析
阿里巴巴开源大数据平台演进之路 - 王峰(莫问)_阿里云
2023-01-04 13:25:09 15.87MB 阿里巴巴 大数据 开源 平台
1
不忘初心,方得始终-盒马数据中台之道 - 李启平(首义)_盒马数据
2023-01-04 13:25:08 5.43MB 盒马 数据中台
1
在Windows环境下开发spark程序,不可避免使用到部分Hadoop功能。为了避免在Windows上报错,给windows打补丁。
2023-01-04 13:25:08 626KB 大数据
1
azkaban
2023-01-04 13:25:07 6KB azkaban
1
大数据团队赛知识框架.xmind
2023-01-04 13:25:06 281KB 大数据
1
电子商务中会产生海量的数据,蕴含着不可估量的数据价值,可通过数据分析来挖掘这些潜在价值,以提升平台的销量。本次实践项目利用 Hadoop 的分布式计算框架 MapReduce 来分析用户行为数据,计算得出商品点击排行、商品分类占比等统计指标,使得更加熟练掌握 MapReduce 程序的设计。 相关理论知识有,Map 和 Reduce 流程图如下:输入数据(INPUT)首先分割(SPLIT)成若干份,然后每份分别进行 MAP 过程;中间再经过 COMBINE 任务(可选)和 PARTTION 对 MAP 所得的结果进行聚合——把同 key 的结果放到同一组,最后再进行 REDUCE 过程。
2022-12-31 12:22:06 4.19MB 电子商务 大数据 Hadoop MapReduce
1
云计算与大数据的关系就像一枚硬币的正反面一样密不可分。大数据必然无法用单台的计算机进行处理,必须采用分布式架构。它的特色在于对海量数据进行分布式数据挖掘。但它必须依托云计算的分布式处理、分布式数据库和云存储、虚拟化技术。大数据技术是一种新一代技术和构架,它以成本较低、以快速的采集、处理和分析技术,从各种超大规模的数据中提取价值。大数据技术不断涌现和发展,让我们处理海量数据更加容易、更加便宜和迅速,成为利用数据的好助手,甚至可以改变许多行业的商业模式。 本资源介绍了大数据和云计算的基本概念、技术及应用。全书分为基础篇、技术与应用篇和实践篇,主要内容包括:绪论、大数据环境下的云计算架构、大数据关键技术与应用、云存储、云服务与云安全、云计算应用、虚拟化技术、Hadoop和Spark平台、分布式文件系统及并行计算框架、分布式数据存储与大数据挖掘。
2022-12-29 09:26:01 88.93MB 云计算 大数据 Hadoop 虚拟化
1
华为云 EI 解决方案-方案
2022-12-27 15:24:43 2.06MB 华为 EI 方案
1
背景:某地区多所学校因为疫情原因,需要采取网上授课的模式进行教学工作。为了更好的管理教学、授课、考评、检查、行政、科研以及后勤等工作,计划搭建一套大数据管理平台来做为各系统的支持与开发工作。
1
成都信息工程大学大数据期末复习问题清单一
2022-12-26 19:27:09 500KB 大数据
1