当前位置:   article > 正文

数仓面试总结

数仓面试

 

2021年5月开始找工作,面试了若干个数仓的岗位,面的差不多也就2个,总结下大致的面试内容

一、字节视频面,上海的一个部门,视频面挂,小伙伴内推的
    这个5月份面的,大概视频面试了一个小时,主要面试内容
    1、问了mapreduce的具体执行过程,这位面试官还问到了执行计划的东西,就是explain sql代码的东西,这个我基本都不会
    2、数仓分层的东西,就大致讲了下分几层还有主题的划分
    3、因为我现在做了一些flink的东西,问了一点流的东西
    4、做了1个sql的题目,相互关注的2个用户怎么找出来
 
 结果:我小伙伴帮忙问了下,说我的数仓知识和技术都薄弱,就这样了


二、运满满,还行,小伙伴内推的
    5月20几号面的,面了3轮,数仓、数据开发部门leader,数据部门leader
    1、基本讲下数据怎么分层,指标库怎么做的,数据质量怎么做的
    2、第二轮就稍微问下数仓的工作,几分钟就过完了
    3、第三轮是视频面的,大致讲下数据方面的看法之类的,这个leader我觉得思想还是高一个层次的

三、拼多多,视频面挂
    这个面试体验很不好,可能面试我的是个大佬,就是大家的思路好像不在一条线上
    1、先问了下之前数分的工作做了啥,然后讲下之前数分的项目,我就大致说了下,然后说我:应该说下你是什么角色,具体做了什么事,有哪些可以改进的点等等;我是很懵逼的
    2、做几道sql的题目,具体的忘了
    3、然后接着说mapreduce的东西,就问,map是怎么个执行方式,reduce是怎么执行的
    4、还问了flink的东西,底层嘛肯定是不怎么了解的
    5、最后给我一通教育


四、美团,视频面挂
     1、讲下mapreduce的具体执行过程,这个sql select a,count(distinct b) from table1 group by a在mapreduce上是怎么执行的
     2、看我不怎么会出了个sql题目,连续登陆的用户取出来,这个题目之前还写过,紧张了还写错了---解题
     3、还问了,知道什么olap的引擎,怎么调优之类的,这个我感觉是大数据开发的东西应该

五、paypal,小伙伴内推的,视频面挂
    1、讲下我们这边具体做啥
    2、问了一个代码的题目,怎么从数组中拿出来最大值,就是简单循环,我也是写的稀烂;一个sql的题目

结果:这个其实工作内容差别还是有的,我理解他们是没有数仓概念的,应该是只做dw层清洗工作


六、波克城市,小伙伴内推的,面了2轮,没后续了
    1、简单自我介绍,具体做啥,日常维护多少任务,计算量多少之类的
    2、leader面,具体讲下都做啥,用的啥组件

结果:这个我觉得回答的还好,不过他们其实是没有数仓概念的,东西都是在mysql上搞的,最后也没要我


七、叮咚买菜,小伙伴内推的,面了4轮,过了

    1、做了面试题,有3道,4个题目

        第一题考察行转列
        第二题考察连续登陆,就搞个row_number排序减一下
        第三题简单

    2、数仓面试,自我介绍,问了些简历上写的东西,还有问了数据质量怎么把握的,数据分了几层,各层都放啥东西,还有你认为数据工作最重要的是啥,写过啥udf,没问mapreduce的东西

    3、数仓的leader应该,问的很细,简历上的东西挨着问,之前数分写的东西都在问,这里还说到我数分的工作看起来好像不专业,比如专业术语也没有,python也不用,我还解释说基本没见到互联网公司有用python做数分的;
       问的东西也大差不差,问了下编程语言用啥,我就说都是抄包的东西,底层不会,问了工作方向

    4、上一个又找了做埋点的同学又问了点埋点方案啥的,就讲下埋点怎么埋的之类的,数据流程是什么样子的

    5、这个应该是数据部门的老大,也问了一堆埋点的东西和之后的个人规划

结果:说是面试过了,谈薪资

总结:
    1、代码还是重要的,不管是java,scala,python,还是要写的,虽然日常工作不怎么用
    2、面试还是要准备,我是头铁,没有专门针对,mapreduce这个东西问了好几次也没认真看
    3、面试也是主观的印象,都是个人适应公司,且很多面试都是会问自己知道的东西,个人多调整心态
    4、大数据东西是真的多,要做到精通,底层还是要学习的,希望都能当上大佬

声明:本文内容由网友自发贡献,转载请注明出处:【wpsshop博客】
推荐阅读
相关标签
  

闽ICP备14008679号