当前位置:   article > 正文

什么是特征、标签、训练、过拟合、泛化?_特征和标签

特征和标签

1、机器学习的过程

要让机器学会认识世界,首先要由数据。

 

2、特征、标签、属性值

像要判断草莓甜不甜,就先要搜集一些关于草莓的数据,例如个头较小、色泽鲜艳、质地柔软的草莓是甜的;个头较大、色泽较浅、质地坚硬的草莓是酸的;在机器学习中,大小、色泽和质地都被称为特征(feature)。较小,鲜艳,较软对应的是属性值(attribute value);酸和甜则被称为标签(label)。

机器学习就是要找到特征与标签之间的关系来判断草莓是不是甜的?

 

3、泛化与过拟合

    通过数据学得模型的过程就是我们常说的学习(learning),也称为训练(training)。

   在学习的过程中,有时候太过认真的认识已有的草莓,会造成无法判断其他草莓甜不甜的状况,这种情况,我们称为过拟合(overfitting)。

   往往我们希望学得的模型能很好的认识新的草莓,这种能力,我们称为泛化(generalization)。

   一般来说,训练样本越多,模型的泛化能力越好,就越能判断新的草莓是不是甜的。

 

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/菜鸟追梦旅行/article/detail/144989
推荐阅读
相关标签
  

闽ICP备14008679号