赞
踩
将HiveSQL转换为MapReduce提交到集群上运行,简化了编写MapReduce的复杂性。
由于MapReduce计算模型(基于磁盘)执行效率比较慢,于是Spark(基于内存)推出了SparkSQL
将SparkSQL转换为RDD,然后提交到集群上运行,执行效率比MapReuce快。