该资源总共包括23份学习资料,从Spark入门到底层实现都有包含,还有对Spark的架构以及内核的解析,同时还有Spark的实战,Spark集群的构建和Spark的相关编程实现
2021-06-15 13:07:17 152.86MB 大数据 spark 学习资料 必读书目
资源名称:Spark大数据实例开发教程资源截图: 资源太大,传百度网盘了,链接在附件中,有需要的同学自取。
2021-06-15 10:51:53 127B Spark大数据实例开发教程
1
Spark 项目流 org.apache.spark/spark-streaming_2.12/2.4.1/spark-streaming_2.12-2.4.1.jar
2021-06-15 00:25:58 1.1MB streaming processing distributed spark
1
Spark 项目流 org.apache.spark/spark-streaming_2.11/2.1.1/spark-streaming_2.11-2.1.1.jar
2021-06-15 00:06:48 2MB streaming processing distributed spark
1
使用spark集成flume,由于flume默认只支持pull消息的方式,不过它可以自定义消息拉取方式,现要使用poll方式,可以使用spark-streaming-flume-sink_2.11-2.1.0.jar包下的org.apache.spark.streaming.flume.sink.SparkSink
2021-06-14 23:11:30 85KB Spark flume
1
Spark期末大作业.docx
2021-06-14 22:00:17 2.9MB 软工1804Spark期末大作
1
包括normal.txt 和spam.txt两个文件,分别表示有效邮件文本和垃圾邮件文本,两个文件各含有25封邮件内容
2021-06-14 21:44:14 5KB Spark MLlib
1
https://blog.csdn.net/m0_51197424/article/details/117905198 spark-core对应练习文件
2021-06-14 17:06:03 2.75MB spark
1
作业
2021-06-13 22:00:37 1.41MB spark
1
CentOS Linux中搭建Hadoop和Spark集群详解,Hadoop是一个开源的可运行于大规模集群上的分布式文件系统和运行处理基础框架。其擅长于在廉价机器搭建的集群上进行海量数据(结构化与非结构化)的存储与离线处理。Hadoop就是一门用来处理大数据的技术,就是用来解决上述提到的分布式计算里面的5个技术难题的。
2021-06-13 18:50:15 1.94MB hadoop spark
1