赞
踩
累加器是具有加法运算和最终累加结果的一种简单结构,可在作业结束后使用。
最简单的累加器就是计数器: 你可以使用 Accumulator.add(V value)
方法将其递增。在作业结束时,Flink 会汇总(合并)所有部分的结果并将其发送给客户端。
Flink 目前有如下内置累加器。都实现了累加器接口。
如何使用累加器:
首先,在需要使用累加器的用户自定义的转换 function 中创建一个累加器对象(此处是计数器)。
private IntCounter numLines = new IntCounter();
其次,你必须在 rich function 的 open()
方法中注册累加器对象。也可以在此处定义名称。
getRuntimeContext().addAccumulator("num-lines", this.numLines);
现在你可以在操作 function 中的任何位置(包括 open()
和 close()
方法中)使用累加器。
this.numLines.add(1);
最终整体结果会存储在由执行环境的 execute()
方法返回的 JobExecutionResult
对象中(当前只有等待作业完成后执行才起作用)。
myJobExecutionResult.getAccumulatorResult("num-lines")
单个作业的所有累加器共享一个命名空间。因此你可以在不同的操作 function 里面使用同一个累加器。Flink 会在内部将所有具有相同名称的累加器合并起来。
赞
踩
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。