- 连通性模型：顾名思义，这些模型基于数据点在数据空间中越接近，彼此之间的相似性就越高，而距离较远的数据点则相似性较低。这些模型可以采用两种方法。第一种方法是将所有数据点分类为单独的簇，然后随着距离的减小进行聚合。第二种方法是将所有数据点分类为单个簇，然后随着距离的增加进行划分。此外，距离函数的选择是主观的。这些模型非常易于解释，但缺乏处理大型数据集的可扩展性。这些模型的例子是层次聚类算法及其变体。

- 质心模型：这些是迭代聚类算法，其中相似性的概念是通过数据点与簇的质心的距离来推导的。K-Means聚类算法是一种流行的属于这一类的算法。在这些模型中，需要预先指定最终所需的簇的数量，这要求对数据集有先验知识。这些模型通过迭代寻找局部最优解。

- 分布模型：这些聚类模型基于所有簇中的数据点属于同一分布（例如：正态、高斯）的可能性。这些模型往往容易过拟合。这类模型的一个流行例子是期望最大化算法，它使用多元正态分布。

- 密度模型：这些模型在数据空间中搜索数据点密度不同的区域。它将各种不同密度的区域隔离开来，并将这些区域内的数据点分配到同一个簇中。密度模型的流行例子是DBSCAN和OPTICS。


from IPython.display import Image
Image(filename='./Lesson33-cluster.png')

导入函数库


import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
import sklearn.cluster as cluster
import time
%matplotlib inline

加载数据集

data = np.load('

声明：本文内容由网友自发贡献，不代表【wpsshop博客】立场，版权归原作者所有，本站不承担相应法律责任。如您发现有侵权的内容，请联系我们。转载请注明出处：https://www.wpsshop.cn/w/笔触狂放9/article/detail/72861