当前位置:   article > 正文

《Python机器学习及实践:从零开始通往Kaggle竞赛之路》第2章 基础篇 学习笔记(十二)2.2.1.1K均值算法总结_利用optdigits.tra数据集进行训练一个3层神经网络模型,再对optdigits.tes数据

利用optdigits.tra数据集进行训练一个3层神经网络模型,再对optdigits.tes数据集进

目录

2.2.1.1K均值算法

0、引言

(1)无监督学习

(2)数据聚类

1、模型介绍

2、数据描述

(1)数据下载

(2)数据描述

3、编程实践

4、性能测评

(1)ARI指标

(2)轮廓系数

5、特点分析


2.2.1.1K均值算法

0、引言

(1)无监督学习

无监督学习着重于发现数据本身的分布特点。与监督学习不同,无监督学习不需要对数据进行标记。这样,在节省大量人工的同时,也让可以利用的数据规模变得不可限量。

从功能角度讲,无监督学习模型可以发现数据的“群落”,同时也可以寻找“离群”的样本;另外对于特征维度非常高的数据样本,同样可以通过无监督的学习对数据进行降维,保留最具有区分性的低纬度特征。这些都是在海量数据处理中是非常实用的技术。

(2)数据聚类

数据聚类是无监督学习的主流应用之一。最为经典并且易用的聚类模型,当属K均值(K-means)算法该算法要求预先设定聚类的个数,然后不断更新聚类中心;经过几轮这样的迭代,最后的目标就是要让所有数据点到其所属聚类中心的平方和趋于稳定。

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/很楠不爱3/article/detail/347140
推荐阅读
相关标签
  

闽ICP备14008679号