举个例子,当年没有数据库的时候,人们编程来操作文件系统,这相当于我们编写mapreduce来分析数据后来有了数据库,再没人操作文件系统了(除非有其它需求),而是直接使用sql和一些语言(php,java,python)来操作数据.这就相当于hive+python了hive+python能解决大多的需求,除非你的数据是非结构化数据,此时你就回到了远古时代不得不写mapreduce了.而为什么不使用hive+java,hive+c,hive+...因为:python真是太好用了,脚本语言,无需编译,有强大的机器学习库,适合科学计算(这就是数据分析啊!!)hive与python的分工:使用hives
1