赞
踩
K最近邻算法(K-Nearest Neighbor, KNN)是最基本的分类算法,其基本原理是:从最近的K个邻居(样本)中,选择出现次数最多的类别作为判定类别。K最近邻算法可以理解为是一个分类算法,常用于标签的预测,如性别。
实现KNN算法核心的一般思路:
K值的选择是选择统计的样本数量,K值得选择会对KNN算法产生较大得影响。
在实际上,K值一般选择较小的数,也可以选择交叉验证的方法寻找最优K值。
利用KNN算法实现性别判定:很多时候,用户在注册的时候,没有填写性别,这个时候,可以通过KNN预测。
- import numpy as np
-
- class KNN:
- def __init__(self, k):
- self.k = k
-
- def createData(self):
- features = np.arr
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。