spark-2.0.0-bin-hadoop2.7.tgz.zip 提示:先解压再使用,最外层是zip文件
2024-06-20 17:18:50 177.76MB spark
1
spark的调优案例分享
2024-06-16 19:38:07 4.38MB spark
1
linux的spark新版本,匹配hadoop2.7版本,spark-3.2.1-bin-hadoop2.7.tgz
2024-06-12 19:45:48 260.01MB spark linux
1
此套面试题来自于各大厂的真实面试题及常问的知识点,如果能理解吃透这些问题, 你的大数据能力将会大大提升,进入大厂指日可待,包含Hadoop spark flink hive hbase kafka doris clickhouse
2024-06-10 23:58:37 2.1MB hadoop spark
1
spark考试(练习题)编程!
2024-05-29 09:51:45 152KB spark
1
Apache Spark 是专为大规模数据处理而设计的快速通用的计算引擎。Spark是UC Berkeley AMP lab (加州大学伯克利分校的AMP实验室)所开源的类Hadoop MapReduce的通用并行框架,Spark,拥有Hadoop MapReduce所具有的优点;但不同于MapReduce的是——Job中间输出结果可以保存在内存中,从而不再需要读写HDFS,因此Spark能更好地适用于数据挖掘与机器学习等需要迭代的MapReduce的算法。 Spark 是一种与 Hadoop 相似的开源集群计算环境,但是两者之间还存在一些不同之处,这些有用的不同之处使 Spark 在某些工作负载方面表现得更加优越,换句话说,Spark 启用了内存分布数据集,除了能够提供交互式查询外,它还可以优化迭代工作负载。 Spark 是在 Scala 语言中实现的,它将 Scala 用作其应用程序框架。与 Hadoop 不同,Spark 和 Scala 能够紧密集成,其中的 Scala 可以像操作本地集合对象一样轻松地操作分布式数据集。
2024-05-20 12:40:42 381.9MB spark
1
基于Spark框架的新闻推荐系统的设计与实现
2024-04-26 15:10:34 6.76MB
1
如果你的计算机上已经安装了Hadoop,本步骤可以略过。这里假设没有安装。如果没有安装Hadoop,请访问Hadoop安装教程_单机/伪分布式配置_Hadoop2.6.0/Ubuntu14.04,依照教程学习安装即可。注意,在这个Hadoop安装教程中,就包含了Java的安装,所以,按照这个教程,就可以完成JDK和Hadoop这二者的安装。
2024-04-18 20:49:00 127KB hadoop spark
1
文档非常详细,分为四个部分: ①VMware的安装 ②VMware下安装Ubuntu ③Hadoop的安装与配置 ④Spark的安装配置
2024-04-18 20:47:14 7.7MB spark hadoop vmware ubuntu
1
基于hadoop2.7.2,scala2.11的sparklinux软件包,解压到指定目录后即可使用,实测可行
2024-04-13 17:58:26 191.82MB spark
1