赞
踩
泛化(Generalization)是指模型很好地拟合以前未见过的新数据(从用于创建该模型的同一分布中抽取)的能力。
学习目标
过拟合现象,虽然损失函数值很低,但是泛化能力很差,所以模型在预测新的数据会表现的很糟糕
奥卡姆的威廉是 14 世纪一位崇尚简单的修士和哲学家。他认为科学家应该优先采用更简单(而非更复杂)的公式或理论。奥卡姆剃刀定律在机器学习方面的运用如下:
机器学习模型越简单,良好的实证结果就越有可能不仅仅基于样本的特性。
现今,我们已将奥卡姆剃刀定律正式应用于统计学习理论和计算学习理论领域。这些领域已经形成了泛化边界,即统计化描述模型根据以下因素泛化到新数据的能力:
虽然理论分析在理想化假设下可提供正式保证,但在实践中却很难应用。ML速成课程则侧重于实证评估,以评判模型泛化到新数据的能力。
ML模型旨在根据以前未见过的新数据做出良好预测。但如果要根据数据集构建模型,如何获得以前未见过的数据呢?一种方法是将您的数据集分成两个子集:训练集(用于训练模型的子集)和测试集(用于测试模型的子集)。
一般来说,在测试集上表现是否良好是衡量能否在新数据上表现良好的有用指标,前提是:
以下三项基本假设阐明了泛化:
在实践中,我们有时会违背这些假设。例如:
如果违背了上述三项基本假设中的任何一项,那么我们就必须密切注意指标。
总结
以上整理转载在谷歌出品的机器学习速成课程点击打开链接 侵删!
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。