当前位置:   article > 正文

2024 大模型面试指南:兄弟们,冲啊_大模型 问题提槽怎么做

大模型 问题提槽怎么做

前言

老宋这俩月又跳槽了,自从去年从百度出来来到新公司,躺了一年,最近因为大模型技术发展,重新有了奋斗的方向和动力。

大模型的诞生必然会重塑整个 NLP 方向,因此,必须参与到这波浪潮中,果然,这行就是得奋发向上,不然躺的时间久了真滴容易被时代抛弃。

话不多说,来聊聊这次的跳槽过程。

萌生跳槽想法


其实早在4月份左右就想跳槽,那时候其实想回大厂,但是当时题也没有刷,且在这家公司还没有呆够一年,于是迟迟没有下定决心跳槽,毕竟躺着是真舒服。

到了5月份,又发生了一些事情,整个人丧了下来,到了8月份才开始重整旗鼓,决定跳槽。当时跳槽的想法其实很简单:大模型这波浪潮必将引发生成式AI 接下来的发展,要是不懂大模型一整套东西,很容易被时代抛下。

面试过程


到了8月10号左右开始投简历,到10月初初步定了offer范围,这次战线拉的还是太长了,不过最后的结果符合我的预期。

整个的面试思路主要分为三个方向:

  • 方向1:先面试大模型应用方向,看看各个公司在应用端的思考

  • 方向2:面试大模型垂域基座方向,看看垂域的基座落地情况

  • 方向3:面试大模型基座方向,看看最顶级的基座是怎么做的

本次面试一大缺陷是,题是边面边刷的,前期很多面试都挂在题上了,后期倒是一面一个过。

第一波:8-9月


第一波主要投了一些中小厂公司,如知乎,360数科,新浪,伊对,面壁,以及阿里的几个NLP不强的部门如高德等。

第一波刚开始没有刷题,八股文也没怎么看,直接裸面,感觉很酸爽。

这一波主要还是积累面试经验,找找感觉,其中知乎和360数科很快发了offer,其余挂的原因如下:

  • 新浪:给不起钱挂了

  • 智谱:挂,题没做出来,不该这么早面的,这家水平蛮高的,值得重视。

  • 伊对:跟面试官气场不和,面试官有点傲气凌然的感觉,于是自己主动结束了面试

  • 面壁智能:题没做出来,挂了,这个不应该放在前期面,这家要求蛮高的,该好好准备的。猎头老催面试,真不能听猎头瞎说。

  • 阿里高德:三面挂,应该是我说不想做大模型在ner,分类方向的应用

  • 阿里优酷:题没做出来。

  • 天眼查:二面主动结束面试了。

  • 阿里 LAZADA:说不想做大模型在ner,分类的应用。

  • 作业帮:题没做出来。

  • 百度-语音语义一体化:跟大模型没关系,一面主动结束面试。

  • 百度电商:新部门,感觉风险大,二面主动结束面试。

  • 高途:二面主动结束面试

面了十多天,基本上俩offer,360数科和知乎,阿里一个没过也是出乎意料,打击了我的自信。跟知乎和360数科仔细聊了聊工作内容,果断拒掉了。

第二波:9-10月


此时,我注意到了刷题的重要性,开始迅速补齐短板,大概刷了200+道左右。接下来主要面了几家公司:

  • 阿里-夸克:挂,面了两次,题都出的忒偏了,出几何题,不知道是故意难为我还是就是这种风格,无缘。

  • 阿里淘天:三面主动结束面试,说是只有知识图谱方向了,我不想去。

  • 美团外卖:三面主动结束面试,非大模型基座方向。

  • 好未来:offer,大模型垂类基座,好未来有很强的转型需求,我蛮看好在教育场景落地的,没双减我就去了。

  • 字节-剪映:一面主动结束面试,去了做搜推,不太感兴趣。字节加班太多,因此我主要是以感受为主。

  • 中科创达:二面主动结束面试,车上的大模型,感觉风险有点大。

  • 金山云:offer。

  • 美团-语音交互部:二面主动结束面试。我有兄弟在里面,其实挺想去的,但是纠结了很久还是想做 50B 以上的model。

  • baichuan:一面主动结束面试,这家其实我很想去,因为我蛮看好的。但是跟面试官聊,面试官很着急,也不知道为啥,问的深度也不深,总是浅尝截止,还judge了我,我不太喜欢这种面试,就主动结束了。

  • 百度-文心一言 ernie 组:offer,本来非常想去。

拿完百度文心后,我就开始躺了,毕竟在我心中,百度文心是国内最顶级团队。但是跟经理聊了聊,发现做的方向不确定性很大,并且加班强度非常大,忍痛拒绝了。后面有其他非常好的团队约面我都拒绝了,面不动了。

总的来看,这次面试通过率前期比较低,主要还是挂在题上,后期基本都能过,主要是题刷够了。

还有一些非常牛逼的团队拒了我简历,因为我躺了一年,简历还是有所影响的,比如腾讯混元。

这次面试也有几个筛选标准,比如说太卷的不去如字节,太小的不去,钱少的不去等。

到此,面试就初步告一段落了,实在是面不动了,最后还是选了相对work-banlance的一家。

为啥不开卷?


这里有必要聊一聊我为啥不开卷。

首先就是奋斗的意义问题,众所周知,我国的税很高,五险也是税,那么涨工资的意义在哪呢?你累死累活都交税了,卷个屁啊。

其次就是生活问题,人这一辈子就活这么一次,总不能你回首往事时,发现自己的人生一大半都在学习和加班吧?

最后就是身体,懂得都懂。

本次面试教训总结


  • 要先刷够300道再面,不能直接裸面

  • 八股文先总结一遍,做到非常熟悉

  • 练手三家即可,圈定好核心面试的公司,别面太多家,太累了

  • 别去不知名的小厂,不然影响简历太严重

面试常见题


接下来我来讲讲面试中经常遇到的题,以及这些题的简单回答,主要包括:

  • 文本生成的重复问题

  • 介绍下 ChatGLM

  • 介绍下baichuan

  • 介绍下 CRF

  • 介绍下Deepspeed的zero

  • 介绍下 Adam的原理和思想

  • FP16,BP16区别

  • 介绍下 GLU 和 SwiGLU

  • 介绍下 Lora

  • 介绍下 Lamma 系列

  • 介绍下 Transformer

  • 介绍下 BART,以及 BART与T5的区别

  • BN 和 LN

  • 介绍下交叉熵

  • 几个位置编码的区别

  • 详细介绍下旋转位置编码

  • 简单介绍下分词方式

  • 用torch 实现欧氏距离

  • 三大并行方式

  • 大小王概率题

大家想要获得上述面试题的详细回答,可以下方获取

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/IT小白/article/detail/878765

推荐阅读
相关标签