什么是特征、标签、训练、过拟合、泛化？_特征和标签

作者：菜鸟追梦旅行 | 2024-02-26 07:46:40

踩

特征和标签

1、机器学习的过程

要让机器学会认识世界，首先要由数据。

2、特征、标签、属性值

像要判断草莓甜不甜，就先要搜集一些关于草莓的数据，例如个头较小、色泽鲜艳、质地柔软的草莓是甜的；个头较大、色泽较浅、质地坚硬的草莓是酸的；在机器学习中，大小、色泽和质地都被称为特征（feature）。较小，鲜艳，较软对应的是属性值(attribute value)；酸和甜则被称为标签(label)。

机器学习就是要找到特征与标签之间的关系来判断草莓是不是甜的？

3、泛化与过拟合

通过数据学得模型的过程就是我们常说的学习（learning），也称为训练（training）。

在学习的过程中，有时候太过认真的认识已有的草莓，会造成无法判断其他草莓甜不甜的状况，这种情况，我们称为过拟合(overfitting)。

往往我们希望学得的模型能很好的认识新的草莓，这种能力，我们称为泛化（generalization）。

一般来说，训练样本越多，模型的泛化能力越好，就越能判断新的草莓是不是甜的。

声明：本文内容由网友自发贡献，不代表【wpsshop博客】立场，版权归原作者所有，本站不承担相应法律责任。如您发现有侵权的内容，请联系我们。转载请注明出处：https://www.wpsshop.cn/w/菜鸟追梦旅行/article/detail/144989