当前位置:   article > 正文

交叉验证的方法汇总_重复交叉验证

重复交叉验证

交叉验证的方法

  1. 留一验证

    • 解释:

      只从可用的数据集中保留一个数据点,并根据其余数据训练模型。此过程对每个数据点进行迭代,比如有n个数据点,就要重复交叉验证n次。例如下图,一共10个数据,就交叉验证十次
      • 图示如下:

      在这里插入图片描述
      • 优点

        • 适合数据集量级较小
        • 因为利用了所有的数据点,因此偏差比较低
      • 缺点

        • 因为重复执行验证,执行时间比较长
        • 因为是数据点进行验证,如果数据点是离群值,那么模型的准确度就会大大受到影响
  2. K折交叉验证

    1.解释:

    进行多次train_test_split划分;每次划分时,在不同的数据集上进行训练、测试评估,从而得出一个评价结果;如果是5折交叉验证,意思就是在原始数据集上,进行5次划分,每次划分进行一次训练、评估,最后得到5次划分后的评估结果,一般在这几次评估结果上取平均得到最后的评分

    • 图示如下:

声明:本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:【wpsshop博客】
推荐阅读
相关标签
  

闽ICP备14008679号