赞
踩
这里写的是最简单的k-means,随机情况不好的情况下会出现nan。
当然,有方法解决这个问题,但是这里只是展示一下k-means的一个基本流程
import numpy as np
import matplotlib.pyplot as plt
import random
创建散点,用来聚类
np.random.seed(5)
class_a=np.random.uniform(0,100,(100,2))
class_b=np.random.uniform(110,400,(100,2))
class_c=np.random.uniform(310,600,(100,2))
class_d=np.c_[np.random.uniform(0,100,100),np.random.uniform(100,600,100)]
class_e=np.c_[np.random.uniform(500,600,100),np.random.uniform(0,400,100)]
data=np.r_[class_a,class_b,class_c,class_d,class_e]
def k_means(data,n=2,train_epoch=10):
k=np.random.uniform(data.min(),data.max(),(n,2))
for j in range(train_epoch):
# 计算距离
distance=np.transpose([np.sqrt(np.sum(np.square(data-i),axis=1)) for i in k])
# 确定归属
affiliation=np.argmin(distance,axis=1)
# 移动质心
k=np.array([data[affiliation==i].mean(axis=0) for i in range(n)])
return k
plt.figure(figsize=(16,9))
k=k_means(data,4)
plt.scatter(data[:,0],data[:,1])
plt.scatter(k[:,0],k[:,1])
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。