课程介绍
Apache Kylin是一个开源的分布式分析引擎,为大数据开发人员提供Hadoop/Spark之上的SQL查询接口,以及支持超大规模数据集的多维分析能力,在大数据领域有着广泛的应用,是大数据开发人员的必备技能之一。
本套视频教程版本升级为4.0,涵盖了Kylin新版的重大功能升级,并将构建引擎和查询引擎全部升级为Spark,将存储由HBase升级为HDFS下的Parquet存储,这三方面的升级大大提升了Kylin的Cube构建效率和查询效率。
教程详细讲解了Kylin 4.0的安装部署过程,与其他框架的版本兼容性也进行了充分调研,并基于真实数据案例进行了实操演示。除此之外,教程中增加了由Kylin官方推荐使用的MDX for Kylin。MDX for Kylin是基于Mondrian二次开发,使用Apache Kylin作为数据源的MDX查询引擎,可以集成多种数据分析工具,提供在大数据分析场景下更极致的体验。教程基于真实数据,提供了详尽的安装、配置和使用讲解。