赞
踩
有监督学习的主要目标是从有标签的训练数据中学习模型,以便对未知或未来的数据做出预测。
监督:已经知道样本所需要的输出信号或标签。
以垃圾邮件过滤为例,可以采用有监督的机器学习算法,基于打过标签的电子邮件语料库来训练模型,然后用模型来预测新邮件是否属于垃圾邮件。
带有离散分类标签的有监督学习——分类任务,例如垃圾邮件过滤
有监督学习的另一个子类被称为回归,其结果信号是连续的数值。
分类是有监督学习的一个分支,其目的是根据过去的观测结果来预测新样本的分类标签。
分类标签是离散的无序值。
邮件垃圾检测是典型的二元分类任务。
多元分类任务的典型例子:识别手写字符。
首先,收集包含字母表中所有字母的多个手写示例形成训练集。
当用户通过输入设备提供一个新的手写字符时,预测模型能够准确地将其识别为字母表中的正确字母。
对连续结果的预测,也称为回归分析。
回归分析包括一些预测变量和一个连续的响应变量,试图寻找那些能够预测结果的变量之间的关系。
强化学习的目标是开发系统或代理
通过它们与环境的交互来提高其预测性能
当前环境状态的信息通常包含所谓的奖励信号,可以把强化学习看做是有监督学习相关的领域,然而强化学习的反馈并非标定过的正确标签或数值,而是奖励函数对行动的度量。
代理可以与环境交互完成强化学习,通过探索性的试错或深思熟虑的规划来最大化这种奖励。
强化学习的常见例子是国际象棋。
代理根据棋盘的状态或环境来决定一系列的行动,奖励为比赛结果的输赢。
在有监督学习中训练模型,事先知道正确的答案
在强化学习过程中,定义了代理对特定动作的奖励
然而无监督学习处理的是无标签或结构未知的数据。
使用无监督学习技术,可以在没有已知结果变量或奖励函数的指导下,探索数据结构以提取有意义的信息。
聚类是探索性的数据分析技术,可以在事先不了解组员的情况下,将信息分层有意义的组群。为在分析过程中出现的每个群定义一组对象,它们之间都有一定程度的相似性,但与其它群中对象的差异性很大。
聚类是构造信息和从数据中导出有意义关系的一种有用的技术,它允许营销人员根据自己的兴趣发现客户群,以便订制不同的市场营销计划。
无监督学习的另一个子类是降维。
高维数据的每个观察都伴随着大量测量数据,这对有限的存储空间和机器学习算法的计算性能提出了挑战。
无监督降维是特征预处理中数据去噪的一种常用方法,它也降低了某些算法对预测性能的要求,并在保留大部分相关信息的同时将数据压缩到较小维数的子空间上。
降维有利于数据的可视化,为了通过二维或三维散点图或直方图实现数据的可视化,可以把高维特征数据集投影到一、二或三维特征空间。
鸢尾属植物数据集
数据集中每行代表一朵花的样本数据,每种花的数据按列存储,称为特征数据集。
每个样本为特征矩阵X的一行,每个特征表示为一列。
上标i指第i个训练样本,下标j表示训练数据集的维度。
预处理——整理数据
许多机器学习算法要求所选择特征的测量结果具有相同的单位,以获取最佳性能——通常通过把特征数据变换为[0,1]的取值范围或者均值和单位方差为0的标准正态分布来实现。
某些选定的特征可能是高度相关的,因此在某种程度上是多余的。
在这种情况下,降维技术对于将特征压缩到低维子空间非常有价值。
降低特征空间维数的优点是减少存储空间,提高算法运行的速度。
如果数据集包含大量不相关的特征或噪声,即数据集有较低的信噪比,降维也可以提高模型预测的性能。
训练和选择预测模型
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。