赞
踩
要让机器学会认识世界,首先要由数据。
像要判断草莓甜不甜,就先要搜集一些关于草莓的数据,例如个头较小、色泽鲜艳、质地柔软的草莓是甜的;个头较大、色泽较浅、质地坚硬的草莓是酸的;在机器学习中,大小、色泽和质地都被称为特征(feature)。较小,鲜艳,较软对应的是属性值(attribute value);酸和甜则被称为标签(label)。
机器学习就是要找到特征与标签之间的关系来判断草莓是不是甜的?
通过数据学得模型的过程就是我们常说的学习(learning),也称为训练(training)。
在学习的过程中,有时候太过认真的认识已有的草莓,会造成无法判断其他草莓甜不甜的状况,这种情况,我们称为过拟合(overfitting)。
往往我们希望学得的模型能很好的认识新的草莓,这种能力,我们称为泛化(generalization)。
一般来说,训练样本越多,模型的泛化能力越好,就越能判断新的草莓是不是甜的。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。