赞
踩
如何确定上图中问号处电影的类型呢?
首先我们需要先确定电影中存在的打斗镜头和接吻镜头的个数。
上面则是各个电影的打斗和接吻镜头的个数以及其电影类型,可以以其镜头个数进行坐标的定位,即问号出的坐标为(18,90)
因此可以将问号处与各个电影之间的距离计算出来,如下图
现在我们知道了样本集中所有电影与未知电影的距离,并且从小到大排序,因此我们可以找到k个距离最近的电影,来判断其类型,
比如我们假定k=3,那么最靠近的三个电影都为爱情片,因此我们判断未知电影是爱情片,那如果与未知电影相距的最近三个电影中分别为爱情片,动作片,动作片,那么我们则判断未知电影为动作片,当然我们还可以选择不同的k值来进行判断。
- (1)收集数据:可以使用任何方法
- (2)准备数据:距离计算所需要的数值,最好是结构化的数据格式
- (3)分析数据:可以使用任何方法
- (4)训练算法:此步骤不适用于k——近邻算法
- (5)测试算法:计算错误率
- (6)使用算法:首先输入样本数据和结构化的输出结果,然后运行k近邻算法判定输入样本属于哪个分类,然后对计算处的分类执行后续处理
通过上述的事例我们知道k的取值不同会影响结果的判断,那么我们应该如何确定一个k的取值呢?
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。