赞
踩
目录
无监督学习着重于发现数据本身的分布特点。与监督学习不同,无监督学习不需要对数据进行标记。这样,在节省大量人工的同时,也让可以利用的数据规模变得不可限量。
从功能角度讲,无监督学习模型可以发现数据的“群落”,同时也可以寻找“离群”的样本;另外对于特征维度非常高的数据样本,同样可以通过无监督的学习对数据进行降维,保留最具有区分性的低纬度特征。这些都是在海量数据处理中是非常实用的技术。
数据聚类是无监督学习的主流应用之一。最为经典并且易用的聚类模型,当属K均值(K-means)算法。该算法要求预先设定聚类的个数,然后不断更新聚类中心;经过几轮这样的迭代,最后的目标就是要让所有数据点到其所属聚类中心的平方和趋于稳定。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。