当前位置:   article > 正文

K-fold cross-validation及其R程序

k-fold cross-validation 岭回归r代码

交叉验证(Cross-validation)主要用于建模应用中,例如PCR 、PLS 回归建模中。在给定的建模样本中,拿出大部分样本进行建模型,留小部分样本用刚建立的模型进行预报,并求这小部分样本的预报误差,记录它们的平方加和。这个过程一直进行,直到所有的样本都被预报了一次而且仅被预报一次。把每个样本的预报误差平方加和,称为PRESS(predicted Error Sum of Squares)。交叉验证方法在克服过拟合(Over-Fitting)问题上非常有用。

K-fold cross-validation

{{K折交叉验证,初始采样分割成K个子样本,一个单独的子样本被保留作为验证模型的数据,其他K-1个样本用来训练。交叉验证重复K次,每个子样本验证一次,平均K次的结果或者使用其它结合方式,最终得到一个单一估测。这个方法的优势在于,同时重复运用随机产生的子样本进行训练和验证,每次的结果验证一次,10折交叉验证是最常用的。}}

  1. CVlm {DAAG}    
  2. val=CVlm(df=cv,m=10,form.lm=formula(Y~X1+X2+X3+X4))# m=10(10-fold,df=cv为数据框文件为cv,拟和普通最小二乘法)
  3. Analysis of Variance Table Response: Y
  4.           Df Sum Sq Mean Sq F value  Pr(>F)
  5. X1         1   69.4    69.4   17.19 0.00042
  6. X2         1    4.1     4.1    1.03 0.32210
  7. X3         1   32.3    32.3    8.01 0.00974
  8. X4         1   27.8    27.8    6.88 0.01552
  9. Residuals 22   88.8     4.0                
  10.              
  11. X1        ***
  12. X2           
  13. X3        ** 
  14. X4        *  
  15. Residuals    
  16. ---
  17. Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
  18. fold 1 
  19. Observations in test set2 
  20.                13     16
  21. Predicted   12.03 10.180
  22. cvpred      13.49 10.768
  23. Y            8.40 10.100
  24. CV residual -5.09 -0.668
  25. Sum of squares = 26.4    Mean square = 13.2    n = 2 
  26. fold 2 
  27. Observations in test set3 
  28.                 8    19    26
  29. Predicted   13.52 12.03  8.85
  30. cvpred      13.67 12.02  7.78
  31. Y           12.10 10.80 13.30
  32. CV residual -1.57 -1.22  5.52
  33. Sum of squares = 34.4    Mean square = 11.5    n = 3 
  34. fold 3 
  35. Observations in test set3 
  36.                9    22    25
  37. Predicted   7.87 13.16 17.79
  38. cvpred      8.09 13.22 15.15
  39. Y           9.60 14.90 20.00
  40. CV residual 1.51  1.68  4.85
  41. Sum of squares = 28.7    Mean square = 9.56    n = 3 
  42. fold 4 
  43. Observations in test set3 
  44.                  1   20    27
  45. Predicted   11.428 12.3 11.29
  46. cvpred      11.571 12.5 11.52
  47. Y           11.200 10.2 10.40
  48. CV residual -0.371 -2.3 -1.12
  49. Sum of squares = 6.71    Mean square = 2.24    n = 3 
  50. fold 5 
  51. Observations in test set3 
  52.                 5    17     18
  53. Predicted   11.10 13.05  9.167
  54. cvpred      10.73 12.89  9.229
  55. Y           13.40 14.80  9.100
  56. CV residual  2.67  1.91 -0.129
  57. Sum of squares = 10.8    Mean square = 3.59    n = 3 
  58. fold 6 
  59. Observations in test set3 
  60.                 6    10    21
  61. Predicted   15.33  9.58 12.25
  62. cvpred      13.63  9.76 12.27
  63. Y           18.30  8.40 13.60
  64. CV residual  4.67 -1.36  1.33
  65. Sum of squares = 25.4    Mean square = 8.48    n = 3 
  66. fold 7 
  67. Observations in test set3 
  68.                 12     23    24
  69. Predicted   10.436 15.963 15.21
  70. cvpred      10.486 16.445 15.81
  71. Y           10.600 16.000 13.20
  72. CV residual  0.114 -0.445 -2.61
  73. Sum of squares = 7.03    Mean square = 2.34    n = 3 
  74. fold 8 
  75. Observations in test set3 
  76.                 2      3    11
  77. Predicted    9.48 13.064 11.87
  78. cvpred       9.91 13.202 12.32
  79. Y            8.80 12.300  9.30
  80. CV residual -1.11 -0.902 -3.02
  81. Sum of squares = 11.2    Mean square = 3.72    n = 3 
  82. fold 9 
  83. Observations in test set2 
  84.                  4     7
  85. Predicted   10.716 11.64
  86. cvpred      10.646 12.21
  87. Y           11.600 11.10
  88. CV residual  0.954 -1.11
  89. Sum of squares = 2.13    Mean square = 1.07    n = 2 
  90. fold 10 
  91. Observations in test set2 
  92.                14     15
  93. Predicted   11.26 11.441
  94. cvpred      11.75 11.373
  95. Y            9.60 10.900
  96. CV residual -2.15 -0.473
  97. Sum of squares = 4.84    Mean square = 2.42    n = 2 
  98. Overall (Sum over all 2 folds) 
  99.   ms 5.83 #10折平均的均方为5.83

转载于:https://my.oschina.net/u/1272414/blog/203382

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/笔触狂放9/article/detail/629120
推荐阅读
  

闽ICP备14008679号