【编辑推荐】 从实用角度系统讲解Spark的数据处理工具及使用方法 手把手教你充分利用Spark提供的各种功能,快速编写高效分布式程序 【内容简介】 Spark是一个开源的通用并行分布式计算框架,由加州大学伯克利分校的AMP实验室开发,支持内存计算、多迭代批量处理、即席查询、流处理和图计算等多种范式。Spark内存计算框架适合各种迭代算法和交互式数据分析,能够提升大数据处理的实时性和准确性,现已逐渐获得很多企业的支持,如阿里巴巴、百度、网易、英特尔等各大公司等。 本书系统讲解Spark的使用方法,包括如何在多种机器上安装Spark,如何配置一个Spark集群,如何在交互模式下运行第一个Spark作业,如何在Spark集群上构建一个生产级的脱机\独立作业,如何与Spark集群建立连接和使用SparkContext,如何创建和保存RDD(弹性分布式数据集...
2021-10-14 11:58:51 18.28MB Spark
1
spark-2.4.0-bin-hadoop2.7 ,下载超级慢,放在这里分享给大家.. 加压rar就可以
2021-10-14 10:33:20 212.66MB spark-2.4.0-bin-
1
SparkSQL内置函数
2021-10-14 10:06:00 414KB spark
1
spark基础
2021-10-13 22:02:02 261KB spark
1
org.apache.rocketmq:rocketmq-spark:0.0.1-SNAPSHOT 实际上在maven仓库可能找不到,需要下载源码打包,详见:https://github.com/apache/rocketmq-externals,附打包命令(rocketmq-spark目录):mvn clean install dependency:copy-dependencies -Dmaven.test.skip -Dcheckstyle.skip 当然可以直接在此处下载。
2021-10-13 18:07:48 478KB rocketmq-spark
1
spark电商推荐源码
2021-10-13 18:07:47 8.09MB spark 电商推荐
1
脱敏的测试数据
2021-10-13 18:07:46 1.87MB 大数据 数据分析
1
Yarn-Cluster 官方求Pi案例.md
2021-10-13 16:01:43 4KB spark
1
包括:《Spark大数据处理:技术、应用与性能优 》 《Spark大数据处理技术》 《Spark高级数据分析》 《Spark快速数据处理_中文版》 《大数据Spark企业级实战》 《Spark 编程指南》 方便大家共同学习
2021-10-13 15:07:52 48.48MB Spark 大数据处理 技术
1
linux虚拟机hadoop全分布,安装spark详细流程
2021-10-13 14:01:40 4KB linux spark hadoop
1