当前位置:   article > 正文

《机器学习by周志华》学习笔记-模型评估与选择-01

《机器学习by周志华》学习笔记-模型评估与选择-01

1、目标

训练过程中,努力使「经验误差(训练误差)」最小。

2、过拟合与欠拟合的解决思路

2.1、过拟合

无法彻底解决,只能「缓解」,过拟合是机器学习面临的关键障碍。

2.2、欠拟合

(1)在决策树学习中扩展分支

(2)在神经网络学习中增加训练轮数

(3)...

3、训练集与测试集的产生方法

3.1、留出法

将数据D划分为2个互斥的集合S和T。S作为训练集,另一个T作为测试集(至少含30个样例)。

常见的样本分配方案:是将大约2/3~4/5的样本用于训练,剩余样本用于测试。

注意:

(1)S和T中的样本类别比例需要一致。

(2)通过不同划分方式多次取平均值作为模型评估结果。

3.2、交叉验证法

又称“k倍交叉验证/k折交叉验证”,将样本数据集D中的m个样本划分k(k常用的取值为10、5、15...)个大小相似、数据分布一致(主要指正负样本的分布一致)且互斥的子集(D1、D2、...、Dk),k≦m。

D=D1 ∪ D2 ∪...∪ Dk(Di ∩ Dj=∅且i≠j且m≧k≧2)

每次用k-1个子集作为训练集,1个子集作为测试集。共k次交叉测试结果,取平均值。下图为k=10的时候,10折交叉验证示意图:

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/笔触狂放9/article/detail/697159
推荐阅读
相关标签
  

闽ICP备14008679号