赞
踩
Windows 是处理无限流的核心。Windows 将流分成有限大小的“存储桶”,我们可以在其上应用计算。Flink 是一个优秀的流计算引擎,数据是源源不断的,它认为批处理 Batch 是一种特殊的流计算,在流中分割出一个个窗口,每个窗口相当于有限大小的空间,汇聚了待处理的数据。
window 注意分为两大类型:CountWindow 和 TimeWindow
CountWindow 是与时间没有关系的,比如 数据收集的一定大小(1w)的时候就会触发窗口函数进行计算。
TimeWindow 就是时间窗口,它与时间非常紧密。主要分为三大类:
滚动窗口(Tumbling window)、滑动窗口(Sliding window)、回话窗口(Session window)。
上图按照不同驱动类型,将窗口分成三类。
时间驱动(Time Window,例如:每 10 秒钟)
数据驱动(Count Window,例如:搜集到 100 个事件)
会话窗口(Session Window,一次会话中搜集到的事件)
再往下细分,分成了滚动窗口(Tumbling Window,窗口没有重叠)和滑动窗口(Sliding Window,窗口会有重叠的部分。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。