赞
踩
k均值聚类是一种分区方法。该函数kmeans将数据划分为k 个互斥的簇,并返回它为每个观察分配的簇的索引。 kmeans将数据中的每个观察值视为在空间中具有位置的对象。该函数找到一个分区,其中每个集群中的对象尽可能彼此靠近,并尽可能远离其他集群中的对象。您可以根据数据的属性选择要使用 的距离度量kmeans。像许多聚类方法一样,k-means 聚类要求您在聚类之前指定聚类数k。
与层次聚类不同,k均值聚类对实际观察进行操作,而不是对数据中每对观察之间的差异进行操作。此外,k- means 聚类创建单个级别的集群,而不是多级的集群层次结构。因此,对于大量数据, k- means 聚类通常比层次聚类更合适。
k- means 分区中的每个集群由成员对象和质心(或中心)组成。在每个集群中,kmeans最小化质心与集群所有成员对象之间的距离总和。 kmeans对于支持的距离度量,以不同的方式计算质心簇。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。