赞
踩
欢迎大家指正~~
1.以下说法正确的是()
A.增加模型复杂度,模型在测试集上的准确率就能更好
B.L2正则化的解通常是稀疏的,L1正则化可以使得参数趋向于更平滑
C.对于PCA,我们应该选择使得模型具有最小variance的主成分
D.每次使用K-means算法得到的聚类结果可能会不一样
正确答案:D
解析:
A:增加模型复杂度,模型在测试集上的准确率不一定会更好,可能会过拟合。
B:L1正则化会让一些特征的系数为0,使模型系数化,用于特征选择。而L2正则化只会让一些趋近于0,无法系数化。
C:对于PCA,应该选择的是最大方差的主成分.
2.假设我们想估计A和B这两个参数,在开始状态下二者都是未知的,但如果知道了A的信息就可以得到B的信息,反过来知道了B也就得到了A。可以考虑首先赋予A某种初值,以此得到B的估计值,然后从B的当前值出发,重新估计A的取值,这个过程一直持续到收敛为止,该算法是( )的算法思想。
A极大似然法
B朴素贝叶斯分类器
CEM算法
D贝叶斯决策论
正确答案C
解析:已知样本数据服从K个概率分布,样本具体属于哪个概率分布未知,概率分布参数也未知,先初始化概率分布的参数,判断各个样本的归属.现在已知样本归属,根据样本数据重新计算参数.为EM算法。
下列哪些方法可以用来对高维数据进行降维:
ALASSO
B主成分分析法
C聚类分析
D小波分析法
E线性判别法
F拉普拉斯特征映射
解析:Lasso(Least absolute shrinkage and selection operator, Tibshirani(1996)) 方法是一种压缩估计,它通过构造一个罚函数得到一个较为精炼的模型,使得它压缩一些系数,同时设定一些系数为零。因此保留了子集收缩的优点,是一种处理具有复共线性数据的有偏估计。Lasso 的基本思想是在回归系数的绝对值之和小于一个常数的约束条件下,使残差平方和最小化
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。