上传者: 38745891 
                                    |
                                    上传时间: 2021-02-26 16:06:56
                                    |
                                    文件大小: 251KB
                                    |
                                    文件类型: PDF
                                
                            
                                
                            
                                Spark基于内存计算,提高了在大数据环境下数据处理的实时性,同时保证了高容错性和高可伸缩性,允许用户将Spark部署在大量廉价硬件之上,形成集群。ApacheSparkisanopensourceclustercomputingsystemthataimstomakedataanalyticsfast—bothfasttorunandfasttowrite.Spark是一个开源的分布式计算系统,它的目的是使得数据分析更快——写起来和运行起来都很快。Spark是基于内存计算的大数据并行计算框架。Spark基于内存计算,提高了在大数据环境下数据处理的实时性,同时保证了高容错性和高可伸缩性,允许用