当前位置:   article > 正文

k均值算法——python实现_k均值 python

k均值 python

无监督学习中应用最多的就是聚类,其中k均值算法就是典型的聚类算法,下面是一段从文本中读取30数据,然后进行聚类的过程,包括输出读取的数据集、随机选择的K个初始均值向量、30行数据各自所属的类别以及最后的聚类中心,因为每次是随机选择K个初始均值向量,所以每次运行结果不一样的。

如果各位需要全部引用的话,请标注来源,具体的数据集需要的话,可以找我要。
  1. import numpy as np
  2. import math
  3. # 读取文件
  4. def load_dataset(file_name):
  5. data_list = []
  6. fr=open(file_name,encoding='utf-8-sig')
  7. lines = fr.readlines()
  8. for line in lines:
  9. pas_line = line.strip().split("\t")
  10. flt_line = list(map(eval, pas_line))
  11. data_list.append(flt_line)
  12. return np.array(data_list)
  13. # 路径输入及函数调用后打印
  14. data_set = load_dataset(r"F:\test\1.txt")
  15. print(data_set)
  16. # 计算两个向量之间的欧氏距离
  17. def dist_eclud(vecA, vecB):
  18. vec_square = []
  19. for element in vecA - vecB:
  20. element = element ** 2
  21. vec_square.append(element)
  22. return sum(vec_square) ** 0.5
  23. # 构建k个随机质心
  24. def rand_cent(data_set, k):
声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/很楠不爱3/article/detail/129098
推荐阅读
相关标签
  

闽ICP备14008679号