赞
踩
很多人写得太复杂了,更多人谈到sklearn的时候,早就知道了kmeas的原理,只是想快速上手而已。
我们知道,kmeans是无监督,没有标签。所以,我们的数据如下:
import numpy as np
X = np.array([[1, 2], [1, 4], [1, 0],
[10, 2], [10, 4], [10, 0]])
6个数据点,每一个点是二维的。我们使用kmeas进行聚类。
导入包
from sklearn.cluster import KMeans
#指定要聚多少个类别,以及拟合我们的数据X。
kmeans = KMeans(n_clusters=2, random_state=0).fit(X)#
print(kmeans.cluster_centers_)
#输出聚类中心,我们是两个类,所以有两个中心。
print(kmeans.labels_)
#由于两个类别的中心已经知道,所以这6个点的类别当然也知道,看距离谁最近即可。
print(kmeans.predict([[0, 0], [12, 3]]))
#预测新的2个点的类别。和上面同理。
是不是很简单,核心已经说完了。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。