赞
踩
spark数据倾斜的描述和解决方案(spark_data_skew)
如果有两拨流数据, 带有相同的时间戳,你怎么形成报表(我觉得就不存在这种情况)
如果离线数据带有日期(非时间戳),你怎么检测近30天内连续登陆的数据,要求必须采用批处理。(我直接说CEP,他说假定只允许使用批处理)
袋鼠云主要使用flink sql
这些题目还是有点挖坑的,需要自己想限制条件处理。
时间是2020年11月9日晚上电话面试。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。