算法工程师(CTR,推荐相关)。
记录一些面试过程中遇到的题目,希望对有需要的人有所帮助。
1.介绍一下:logistic regression,svm,gbdt,randomforest,xgboost,lightgbm(一般根据简历有针对性的问)
2.为什么用线性回归做分类效果不好
3.比较一下k-means和高斯混合模型
4.SVM中C越大对模型有什么影响
5.gbdt和randomForest比较, xgboost和lightgbm的比较
6.项目中使用了xgboost,lightgbm,怎么调参的,如何防止过拟合的(重要)
7.level-wise和leaf-wise优缺点比较
8.xgboost在哪些方面做了并行,同样是并行,为什么xgboost会比lightgbm慢很多
9.介绍一下AUC,项目中评价指标为什么使用logloss而不用AUC
10.项目中是怎么做特征选择的(重要)
11.one-hot encoding有什么好处
12.介绍一下卷积神经网络,熟悉哪些经典的网络结构
13.介绍一下反卷积
14.深度学习中如果防止过拟合(重要)
15.dropout原理,如何实现
16.介绍一下batch normlization
17.1*1的卷积有什么特别的用途
18.能够解释一下attention机制么
19.tensorflow在分布式情况下,参数设置需要注意些什么
20.海量数据处理题,这个百度一搜一大把(重要)
21.spark,hadoop相关,一般面试官会出题,让你用mapreduce实现(重要)
21.普通算法编程题(leetcode),每次面试都需要写,对刚毕业没多久的人很重要,不过比校招算法岗出的简单(我司不算)。