赞
踩
无监督学习是机器学习技术中的一类,用于发现数据 中的模式。利用 学习数据的分布或数据与数 据之间的关系被称作无监督学习。
1、k-means算法(聚类算法)
监督学习描述的任务是:当给定输入x,如何通过在有标注输入和输出的数据上训练模型而能够预测输出y
1、通过带有标签的训练集:训练模型
2、通过训练模型,输入新事件自变量x,预测输出y
1、knn(k最近邻算法)属于分类方法。
2、贝叶斯算法、朴素贝叶斯算法,属于分类方法。
3、逻辑回归,属于回归方法。
4、线性回归,属于回归方法。
1.监督学习方法必须要有训练集与测试样本。在训练集中找规律,而对 测试样本使用这种规律。而非监督学习没有训练集,只有一组数据,在该 组数据集内寻找规律。
2. 监督学习的方法就是识别事物,识别的结果表现在给待识别数据加上 了标签。因此训练样本集必须由带标签的样本组成。而无监督学习方法只 有要分析的数据集的本身,预先没有什么标签。如果发现数据集呈现某种 聚集性,则可按自然的聚集性分类,但不予以某种预先分类标签对上号为 目的。
简单的方法就是从定义入手,有训练样本则考虑采用监督学习方法;无 训练样本,则一定不能用监督学习方法。但是,现实问题中,即使没有训 练样本,我们也能够凭借自己的双眼,从待分类的数据中,人工标注一些 样本,并把它们作为训练样本,这样的话,可以把条件改善,用监督学习 方法来做。对于不同的场景,正负样本的分布如果会存在偏移(可能大的 偏移,可能比较小),这样的话,监督学习的效果可能就不如用非监督学 习了。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。