赞
踩
01
背景
在Flink SQL内部进行Query操作时候,无论是unbounded还是bounded数据,TableAPI与SQL保持了一致的语义。在大多数场景下,实时计算的结果与离线的结果可以保持一致。但是因为实时数据是unbounded的,Flink内会为每个key保存相应的State,随着时间的增长以及key的增加,面临超出存储的风险越来越大。在一些 continuous queries 的场景下,你不得不去限制state的大小。是否去限制state的大小,这个取决于数据本身的特性以及query本身是否需要去限制state大小。
02
如何限制state
Table APi&Flink SQL为我们提供了相应的参数,通过TableConfig配置,这两个参数将会影响准确性以及资源消耗。
StreamExecutionEnvironment env = StreamExecutionEnvironment.getExecutionEnvironment();StreamTableEnvironment tableEnv = StreamTableEnvironment.create(env);//获取query configuration 从TableEnvironmentTableConfig tConfig = tableEnv.getConfig();// 设置 query参数tConfig.setIdleStateRetentionTime(Time.hours(12), Time.hours(24));// 定义查询语句Table result = ...// 创建table sinkTableSink sink = ...// 注册table sinktableEnv.registerTableSink( "outputTable", // table name new String[]{...}, // field names new TypeInformation[]{...}, // field types sink); // table sink// 把result表数据发送到sink中result.insertInto("outputTable");// 转换result Table 到 DataStreamDataStream stream = tableEnv.toA
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。