爱喝兽奶帝天荒

这个屌丝很懒，什么也没留下！

热门标签

热门文章

当前位置: article > 正文

秋招面了几家大厂算法岗( 含NLP、搜光推、大模型方向)，复盘面试题来了。。。_师生多轮对话文本(音频转化),如何把无关信息剔除,比如说老师早上好这种

作者：爱喝兽奶帝天荒 | 2024-07-14 07:17:34

赞

踩

师生多轮对话文本(音频转化),如何把无关信息剔除,比如说老师早上好这种

节前，我们组织了一场算法岗技术&面试讨论会，邀请了一些互联网大厂同学、参加社招和校招面试的同学，针对大模型技术趋势、大模型落地项目经验分享、新手如何入门算法岗、该如何准备、面试常考点分享等热门话题进行了深入的讨论。

今天我整理 NLP、搜光推、大模型等算法方向的面试题，分享给大家，希望对后续找工作的有所帮助。喜欢记得点赞、收藏、关注。更多技术交流&面经学习，可以加入我们。

技术交流群

前沿技术资讯、算法交流、求职内推、算法竞赛、面试交流(校招、社招、实习)等、与 10000+来自港科大、北大、清华、中科院、CMU、腾讯、百度等名校名企开发者互动交流~

我们建了算法岗技术与面试交流群，想要进交流群、需要源码&资料、提升技术的同学，可以直接加微信号：mlc2060。加的时候备注一下：研究方向 +学校/公司+CSDN，即可。然后就可以拉你进群了。

方式①、微信搜索公众号：机器学习社区，后台回复：加群
方式②、添加微信号：mlc2060，备注：技术交流

飞猪-搜索算法

飞猪-base杭州-搜索算法

哈希寻址算法
讲一下最短路算法
如何判断图中是否有环
概率题：99%的概率预测正确，0.3%是真阳，p(真阳|阳)的概率等于多少
场景题1：给定当前query和历史query以及对应实体，如何对当前query的实体进行建模
场景题2：多语言如何判断是哪个语种，比如马来西亚语和英语有点相似，应该如何判断
场景题3：query改写 baseline 评估迭代建模，query改写的作用（比如“北大”“北京大学”哪个与酒店更匹配）
场景题4：纠错，相似词建模
场景题记不太清楚了，但是和面试官们交流很愉快

百度-算法工程

百度-base上海-算法工程

c++智能指针
python多进程和多线程
垃圾回收机制
sql事务
讲lora的原理
讲gbdt
翻译任务一般用啥架构
encoder-only, decoder-only, encoder-decoder的区别
讲transformer
讲flash attention
fp32和fp16的区别，混合精度的原理
beam search原理，与直接sample的区别
对大模型的改进
平时用什么框架，机器
python协程
进程，线程，一个进程里面多线程共享哪些资源
程序空间和堆栈
为什么docker好用，docker创建容器
linux怎么看进程; 怎么结束进程; 怎么实时看一个文件
c++虚函数
python，flask
gil全局锁
继续flash attention
大模型什么情况需要预训练
主流大模型的区别
一个数学题：甲乙射击，甲射击n次，乙射击n+1次，射中的概率都是0.5，射中一个得一分，最终乙比甲总分多的概率；

好未来-NLP

好未来-base北京-NLP

lora的矩阵怎么初始化？为什么要初始化为全0？
gpt源码past_key_value是干啥的
gpt onebyone 每一层怎么输入输出
输出的分布如果比较稀疏，有个尖尖应该怎么处理
讲讲决策树，决策树回归问题怎么做
gpt的输出topp是啥
kl散度的公式和kl散度与交叉熵的区别
强化学习的输入
chatgpt的reward model怎么来的，三阶段
cart树的分裂准则是啥
做题：寻找重复数
除了cosin还有哪些算相似度的方法
文本embedding方法
tfidf公式
场景题1：师生多轮对话文本（音频转化），如何把无关信息剔除，比如说老师早上好这种
场景题2：偏推荐一点，给学生推荐试题，不希望出现做过的相似题目

海康-多模态大模型

海康-base杭州-多模态大模型

大模型对输入数据分词的处理，扩大词表
python的多进程，多线程，没有真正意义上的多线程，为什么这么设计
新版pytorch并行bn
口述算法完全平方数
10个模态如何选择和搭模型
clip的各种变形
常用trick，你的别人都不知道的trick(?)
数据不均衡怎么处理
单独整不同模态的编码和clip的区别

腾讯-广告算法

腾讯-base未知-广告算法

做题：
求两个列表的交集，时间复杂度尽可能低，不可以用map和set
求一个数在一个列表中的最大数
ner模型除了gp还有哪些，gp相比普通ner的优点
ner中如何去解决预测错误的问题，比如宝马三系标签是BIBI中的三系
什么是线性可分，逻辑斯蒂是线性还是非线性的
常用的ctr模型
deepfm的fm结构是啥
如果输入特征只有一维，做二分类任务，这个特征范围是从0到正无穷大，怎么处理
nlp任务有哪些

知乎-搜索算法

知乎-base北京-可能是搜索算法

项目
职业规划
项目中的难点
做题-旋转数组求最小值
bert的attention
优化器
知道的loss
能不能马上去实习

虾皮-NLP

虾皮-base上海-NLP

求target在source里的起始终止位置，target和source都有空格，target空格忽略，source空格要算位置。应该是想考kmp模板
多模态一些多流的sota有了解吗
bert的结构和loss
gpt的结构
ner模型的了解
针对不同的任务，大模型的指令怎么写
没有标签，怎么对商品里的iphone pro max做聚合

得物-推荐算法

得物-base杭州-推荐算法

nlogn的排序算法
讲讲堆排序
动态规划
xgb和gbdt的区别
lora的优缺点
bn
random forest和gbdt的区别
有100个硬币，AB每次都可以拿1到2个，最后一个拿的人获胜，A用什么策略可以保证最后他获胜

用通俗易懂方式讲解系列

声明：本文内容由网友自发贡献，不代表【wpsshop博客】立场，版权归原作者所有，本站不承担相应法律责任。如您发现有侵权的内容，请联系我们。转载请注明出处：https://www.wpsshop.cn/w/爱喝兽奶帝天荒/article/detail/823720

推荐阅读

相关标签

Copyright © 2003-2013 www.wpsshop.cn 版权所有，并保留所有权利。

闽ICP备14008679号