赞
踩
Kafka的核心是一个分布式的发布/订阅消息的一个系统。并广泛用于获取和分发事件流。
Flink kafka 连接器会以并行的方式获取事件流。
每个并行的数据源任务都可以从一个或多个分区中读取数据。并通过维护偏移量来保证各分区之间数据的顺序,如果程序开启检查点的话,Flink会将偏移量记录到检查点中。
Q:Flink中基于事件时间的操作需要我们定义水位线,那么在flink kafka中我们如何提取Kafka分区中的事件时间并定义水位线呢?
A:
注意:
如果某一分区变成非活跃状态且不再提供消息,那么这个数据源任务的水位线将无法前进,继而导致整个应用的水位线都不会前进。因此单个非活跃的分区会导致整个应用停止运行。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。