赞
踩
Flink基本组件由三类组成:Data Source(数据源)、Transformations(转换操作)、Data Sink(数据落地)。
在大数据处理领域,批处理任务与流处理任务一般被认为是两种不同的任务,一个大数据框架一般会被设计为只能处理其中一种任务
例如Storm只支持流处理任务,而MapReduce、Spark只支持批处理任务。Spark Streaming是Apache Spark之上支持流处理任务的子系统,看似是一个特例,其实并不是——Spark Streaming采用了一种micro-batch的架构,即把输入的数据流切分成细粒度的batch,并为每一个batch数据提交一个批处理的Spark任务,所以Spark Streaming本质上还是基于Spark批处理系统对流式数据进行处理,和Storm等完全流式的数据处理方式完全不同。
Flink通过灵活的执行引擎,能够同时支持批处理任务与流处理任务
从左到右边分别是极端的流处理和批处理,第三种是Flink的数据传输模型
Flink vs Storm 对比图
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。