赞
踩
还没整理好,别慌。
一,业务问题:
多个表关联join(涉及时间维度跨度很长),几乎等同于全量关联,这个时候flink sql join没法做,因为state会无线增大,然后OOM。
二,解决方案 :
使用doris去做大宽表。
方案1,数据写入ods层,然后sql语句关联定时写入dws层,类似离线批处理。
这种就是替代hive离线计算的方案。
方案2,数据写入大宽表,利用doris特性。
https://cloud.baidu.com/doc/DORIS/s/3kmealtpc
1)创建doris大宽表 -Agg模型
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。