DataFrameAPI的引入一改RDDAPI高冷的FP姿态,令Spark变得更加平易近人。外部数据源API体现出的则是兼容并蓄,SparkSQL多元一体的结构化数据处理能力正在逐渐释放。关于作者:连城,Databricks工程师,Sparkcommitter,SparkSQL主要开发者之一。在4月18日召开的2015Spark技术峰会上,连城将做名为“四两拨千斤——SparkSQL结构化数据分析”的主题演讲。自2013年3月面世以来,SparkSQL已经成为除SparkCore以外最大的Spark组件。除了接过Shark的接力棒,继续为Spark用户提供高性能的SQLonHadoop解决方案
1