本书描述了如何使用Spark架构进行大数据分析,包含了大规模数据处理、机器学习、图分析、高速数据流处理。
2022-04-16 17:27:20 3.73MB 大数据 spark
1
001 - Spark框架 - 简介.avi 002 - Spark框架 - Vs Hadoop.avi 003 - Spark框架 - 核心模块 - 介绍.avi 005 - Spark框架 - 快速上手 - WordCount - 案例分析.avi 009 - Spark框架 - 快速上手 - WordCount - Spark的实现.avi 010 - Spark框架 - 快速上手 - WordCount - 日志和错误.avi 011 - Spark框架 - 运行环境 - 本地环境 - 基本配置和操作.avi 012 - Spark框架 - 运行环境 - 本地环境 - 提交应用程序.avi 013 - Spark框架 - 运行环境 - 独立部署环境 - 基本配置和操作.avi 015 - Spark框架 - 运行环境 - 独立部署环境 - 配置历史服务.avi 019 - Spark框架 - 核心组件 - 介绍.avi 020 - Spark框架 - 核心概念 - Executor & Core & 并行度.avi 023 - SparkCore - 分布式
2022-04-11 14:08:59 3KB big data spark 大数据
大数据spark搭建,spark安装包
2022-04-06 02:48:11 287.03MB big data spark 大数据
1
spark-3.2.1 安装包 集成 hadoop2.7 只将原安装包再压缩为Zip
2022-04-06 02:48:06 260.01MB 大数据 spark
1
提供JAVA和Scala两种实现,里面有详细操作步骤和注释 美团真实业务完整源码实现:https://tech.meituan.com/2016/03/31/spark-in-meituan.html 美团的交互式用户行为分析系统,用于提供对海量的流量数据进行交互式分析的功能,系统的主要用户为公司内部的PM和运营人员。普通的BI类报表系统,只能够提供对聚合后的指标进行查询,比如PV、UV等相关指标。
2022-03-25 09:23:43 10.72MB 美团 大数据 spark 用户行为分析
1
在整个毕业论文设计的过程中我学到了做任何事情所要有的态度和心态, 首先我明白了做学问要一丝不苟, 对于出现的任何问题和偏差都不要轻视, 要通过正确的途径去解决, 在做事情的过程中要有耐心和毅力, 不要一遇到困难就打退堂鼓, 只要坚持下去就可以找到思路去解决问题的。 在工作中要学会与人合作的态度, 认真听取别人的意见,这样做起事情来就可以事倍功半。
2022-03-13 02:16:38 1.38MB 大数据Spark Spark! saprk
项目一Spark离线处理 本项目来源于企业级电商网站的大数据统计分析平台,该平台以?Spark 框架为核心,对电商网站的日志进行离线和实时分析。? 该大数据分析平台对电商网站的各种用户行为(访问行为、购物行为、广告点击行为等)进行分析,根据平台统计出来的数据,辅助公司中的?PM(产品经理)、数据分析师以及管理人员分析现有产品的情况,并根据用户行为分析结果持续改进产品的设计,以及调整公司的战略和业务。最终达到用大数据技术来帮助提升公司的业绩、营业额以及市场占有率的目标。?本项目使用了?Spark 技术生态栈中最常用的三个技术框架,Spark Core、Spark SQL 和?Spark Streaming,进行离线计算和实时计算业务模块的开发。实现了包括用户访问?session 分析、页面单跳转化率统计、热门商品离线统计、广告流量实时统计?4 个业务模块。通过合理的将实际业务模块进行技术整合与改造,该项目几乎完全涵盖了?Spark Core、Spark SQL 和?Spark Streaming 这三个技术框架中大部分的功能点、知识点,学员对于?Spark 技术框架的理解将会在本项目中得
1
大数据开发的准备步骤,各个大数据安装的说明书,hadoop,saprk等
2022-02-11 21:44:32 1.4MB spark Hadoop
1
大数据实验报告Windows环境下安装Spark及RDD编程和Spark编程实现wordcount.doc
2021-12-28 18:07:58 624KB Hadoop大数据 Spark编程 RDD编程 wordcount
Spark是当今大数据领域最活跃、最热门、高效的大数据通用计算平台,是Apache软件基金会下所有开源项目中三大开源项目之一。   在“One Stack to rule them all”理念的指引下,Spark基于RDD成功地构建起了大数据处理的一体化解决方案,将MapReduce、Streaming、SQL、Machine Learning、Graph Processing等大数据计算模型统一到一个技术堆栈中,开发者使用一致的API操作Spark中的所有功能;更为重要的是Spark的Spark SQL、MLLib、GraphX、Spark Streaming等四大子框架之间可以在内存中完美的无缝集成并可以互相操作彼此的数据,这不仅打造了Spark在当今大数据计算领域其他任何计算框架都无可匹敌的优势,更使得Spark正在加速成为大数据处理中心的计算平台。   《大数据Spark企业级实战》详细解析了企业级Spark开发所需的几乎所有技术内容,涵盖Spark的架构设计、Spark的集群搭建、Spark内核的解析、Spark SQL、MLLib、GraphX、Spark Streaming、Tachyon、SparkR、Spark多语言编程、Spark常见问题及调优等,并且结合Spark源码细致的解析了Spark内核和四大子框架,最后在附录中提供了的Spark的开发语言Scala快速入门实战内容,学习完此书即可胜任绝大多数的企业级Spark开发需要。   《大数据Spark企业级实战》从零起步,完全从企业处理大数据业务场景的角度出发,基于实战代码来组织内容,对于一名大数据爱好者来说,《大数据Spark企业级实战》内容可以帮助您一站式地完成从零起步到进行Spark企业级开发所需要的全部核心内容和实战需要。
2021-12-27 15:53:54 139.57MB 大数据 Spark 实战 分布式计算
1