当前位置:   article > 正文

Spark 01 概述_spark01 重访周期

spark01 重访周期

1)介绍

Apache Spark™ is a unified analytics engine for large-scale data processing.

快速通用的处理大规模数据的引擎。

2)产生背景

  • MapReduce局限性

    1)代码繁琐
    2)只能够支持map和reduce方法
    3)执行效率低下
    4)不适合迭代多次、交互式、流式的处理

  • 框架多样化

    1)批处理(离线):MapReduce、Hive、Pig
    2)流式处理(实时):Storm,JStorm
    3)交互式计算:Impala

3)特点

  • 速度快 speed
  • 易用 ease of use
  • 通用 generality
  • 在多平台运行 runs everywhere


这里写图片描述
这里写图片描述
这里写图片描述

4)Spark和Hadoop的协作性

Hadoop优势
这里写图片描述
Spark优势
这里写图片描述

Hadoop+Spark
这里写图片描述

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/小蓝xlanll/article/detail/593273
推荐阅读
相关标签
  

闽ICP备14008679号