当前位置:   article > 正文

Spark应用场景_spark应用场景与案例

spark应用场景与案例

4、Spark应用场景

目前大数据处理场景主要有以下几种类型:

  1. 1、复杂的批处理(Batch Data Processing),偏重点在于处理
  2. 海量数据的能力,至于处理 速度可忍受,通常的时间可能是在数十分钟到数小时;
  3. 2、基于历史数据的交互式查询(Interactive Query),通常的时间在数十秒到数十分钟之间 ;
  4. 3、基于实时数据流的大数据处理(Streaming Data Processing),通常在数百毫秒到数秒之间 ;

目前对以上三种场景需求都有比较成熟的处理框架: 

第一种情况可以用 Hadoop 的 MapReduce 来进行批量海量数据处理

第二种情况可以 Impala、Kylin 进行交互式查询

第三中情况可以用 Storm 分布式处理框架处理实时流式数据 


以上三者都是比较独立,各自一套维护成本比较高,而 Spark 的出现能够一站式平台满意以 上需求。

第一种情况使用 Spark Core 解决

第二种情况使用 Spark SQL 解决

第三种情况使用 Spark Streaming 解决 

通过以上分析,总结 Spark 场景有以下几个: 

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/花生_TL007/article/detail/389411
推荐阅读
相关标签
  

闽ICP备14008679号