当前位置:   article > 正文

袋鼠云大数据面试题回忆_袋鼠云面试问题

袋鼠云面试问题

spark数据倾斜的描述和解决方案(spark_data_skew)

如果有两拨流数据, 带有相同的时间戳,你怎么形成报表(我觉得就不存在这种情况)

如果离线数据带有日期(非时间戳),你怎么检测近30天内连续登陆的数据,要求必须采用批处理。(我直接说CEP,他说假定只允许使用批处理)

Clickhouse原理

 

袋鼠云主要使用flink sql

这些题目还是有点挖坑的,需要自己想限制条件处理。

 

时间是2020年11月9日晚上电话面试。

 

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/小丑西瓜9/article/detail/509011
推荐阅读
相关标签
  

闽ICP备14008679号