当前位置: article > 正文

衡量和测试特征选择方法的稳定性两种方法理解_如何比较两种方法的稳定性

作者：笔触狂放9 | 2024-07-17 21:43:41

踩

如何比较两种方法的稳定性

1、样本扰动方法：对一个数据集进行二次抽样，首先从原始数据集中抽取80％相同的样本，然后将其余样本平均分配到两个数据集中。重复采样20次每次维持88.88％（从90％的原始数据集中抽取80％相同的样本，即（80/90）％）重叠比例，接下来计算经过特征选择之后生成的加权基因序列之间的相似性（即重叠比例）。

2、交叉验证：是指将数据集分成多份或分成相同的（或者越接近越好）几份。前 n-1 份作为学习器的训练集，其中 n 是数据集所分份数，余下的那份则作为测试集。这个过程执行 n 次，因此每份样本子集都会作为测试集进行测试。交叉验证通常用于分类准确率的实验。为了测试算法的稳定性，需要在n-1 份数据集（或者训练集）上进行n次特征选择。

声明：本文内容由网友自发贡献，不代表【wpsshop博客】立场，版权归原作者所有，本站不承担相应法律责任。如您发现有侵权的内容，请联系我们。转载请注明出处：https://www.wpsshop.cn/w/笔触狂放9/article/detail/842161