赞
踩
有如所示西瓜数据集:
西瓜数据集 | ||||
编号 | 色泽 | 根蒂 | 敲声 | 好瓜 |
1 | 青绿 | 蜷缩 | 浊响 | 是 |
2 | 乌黑 | 蜷缩 | 浊响 | 是 |
3 | 青绿 | 硬挺 | 清脆 | 否 |
4 | 乌黑 | 稍蜷 | 沉闷 | 否 |
反映事件或对象在某方面的表现或性质的事项。如下所示,每一行记录为一个示例(样本)。
色泽 | 根蒂 | 敲声 |
青绿 | 蜷缩 | 浊响 |
乌黑 | 蜷缩 | 浊响 |
青绿 | 硬挺 | 清脆 |
乌黑 | 稍蜷 | 沉闷 |
例如上述"色泽"、“根蒂” 、“敲声”。
属性上的取值。例如上述属性"色泽"的取值{“青绿” ,“乌黑”}。
属性张成的空间。例如把"色泽" “根蒂” "敲声"作为三个坐标轴,则它们张成一个用于描述西瓜的三维空间,每个西瓜都可在这个空间中找到自己的坐标位置。
输入空间中每个点对应的坐标向量
例如"好瓜",称为"标记"
拥有了标记信息的示例。如下所示,每一行记录为一个样例。若将标记看作对象本身的一部分,则"样例"有时也称为"样本"
色泽 | 根蒂 | 敲声 | 好瓜 |
青绿 | 蜷缩 | 浊响 | 是 |
乌黑 | 蜷缩 | 浊响 | 是 |
青绿 | 硬挺 | 清脆 | 否 |
乌黑 | 稍蜷 | 沉闷 | 否 |
所有标记的集合
从数据中学得模型的过程称为学习 (learning) 或训练 (training), 这个过程通过执行某个学习算法来完成.训练过程中使用的数据称为训练数据 (training data) ,其中每个样本称为一个训练样本 (training sample), 训练样本组成的集合称为训练集"(training set)
学得模型后,使用其母行预测的过程称为测试 (testing) ,被预测的样本称为测试样本(testing sample)。例如在学得 f f f后,对测试示例 x i x_i xi可得到其预测标记 f ( x i ) f(x_i) f(xi)。测试样本组成的集合称为测试集"(training set)。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。