当前位置:   article > 正文

机器学习笔试题(一)

机器学习笔试

欢迎大家指正~~

1.以下说法正确的是()

A.增加模型复杂度,模型在测试集上的准确率就能更好

B.L2正则化的解通常是稀疏的,L1正则化可以使得参数趋向于更平滑

C.对于PCA,我们应该选择使得模型具有最小variance的主成分

D.每次使用K-means算法得到的聚类结果可能会不一样

正确答案:D

解析:

A:增加模型复杂度,模型在测试集上的准确率不一定会更好,可能会过拟合。

B:L1正则化会让一些特征的系数为0,使模型系数化,用于特征选择。而L2正则化只会让一些趋近于0,无法系数化。

C:对于PCA,应该选择的是最大方差的主成分.

2.假设我们想估计A和B这两个参数,在开始状态下二者都是未知的,但如果知道了A的信息就可以得到B的信息,反过来知道了B也就得到了A。可以考虑首先赋予A某种初值,以此得到B的估计值,然后从B的当前值出发,重新估计A的取值,这个过程一直持续到收敛为止,该算法是(      )的算法思想。

A极大似然法

B朴素贝叶斯分类器

CEM算法

D贝叶斯决策论

正确答案C

解析:已知样本数据服从K个概率分布,样本具体属于哪个概率分布未知,概率分布参数也未知,先初始化概率分布的参数,判断各个样本的归属.现在已知样本归属,根据样本数据重新计算参数.为EM算法。

下列哪些方法可以用来对高维数据进行降维:

ALASSO

B主成分分析法

C聚类分析

D小波分析法

E线性判别法

F拉普拉斯特征映射

解析:Lasso(Least absolute shrinkage and selection operator, Tibshirani(1996)) 方法是一种压缩估计,它通过构造一个罚函数得到一个较为精炼的模型,使得它压缩一些系数,同时设定一些系数为零。因此保留了子集收缩的优点,是一种处理具有复共线性数据的有偏估计。Lasso 的基本思想是在回归系数的绝对值之和小于一个常数的约束条件下,使残差平方和最小化
 

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/繁依Fanyi0/article/detail/484815
推荐阅读
相关标签
  

闽ICP备14008679号