赞
踩
1 机器学习
传统的机器学习就是利用统计学的基本观点,利用要学习的问题的历史样本数据的分布对总体样本分布进行估计。分析数据大致特性建立数学分布模型,并利用最优化的知识对模型的参数进行调优学习,使得最终的学习模型能够对已知样本进行很好的模拟与估计。这样说很难直观理解,所以接下来从机器学习特点、机器学习要素、模型的评估选择四个方面介绍
1.1 机器学习特点
1.机器学习以数据为研究对象,是数据驱动的科学;
2.机器学习的目的是对数据进行预测与分析;
3.机器学习以模型方法为中心,利用统计学习的方法构建模型并且利用模型对未知数据进行预测和分析。
1.2机器学习对象
机器学习研究的对象是多维向量空间的数据。它从各种不同数据的类型出发,提取数据的特征,抽象出数据的模型,发现数据中的知识,又回到数据的分析与预测中去
1.3机器学习分类
1.有监督学习
有监督学习是指进行训练的数据包含两部分信息:特征向量+类别标签。也就是说,在训练的时候每一个数据向量所属的类别是事先知道的。在设计学习算法的时候,学习调整参数的过程会根据类标进行调整,类似于学习的过程被监督了一样,而不是漫无目的地去学习
2.无监督学习
无监督学习的训练数据没有类标,只有特征向量。甚至很多时候我们都不知道总共有多少个类别。因此,无监督学习就不叫分类,而是称为聚类。就是采用一定的算法,把特征性质相近的样本聚在一起成为一类。
3.半监督学习
结合监督学习和无监督学习,近年来研究的热点。在真正的模型建立过程中,往往有类标的数据很少,而绝大多数的数据样本是没有确定类标的。这个时候,我们无法直接应用有监督的学习方法进行模型训练,因为有监督学习算法在有类标数据很少的情况下学习的效果往往很差。但是我们也不能直接利用无监督学习的方式进行学习,因为这样,我们就不能利用那些已经给出的类标信息。
4.强化学习
强化学习就是智能系统从环境到行为映射的学习,以使奖励信号(强化信号)函数值最大,强化学习不同于连接主义中学习中的监督学习,主要表现在教师信号上,强化学习中由环境提供的强化信号是对产生动作的好坏作一种评价(通常为标量信号),而不是告诉强化学习系统如何去产生正确的动作。
1.4机器学习的要素
模型,策略和算法
1.模型
就是机器学习训练过程中所要学习的条件概率分布或者决策函数
2.策略
就是使用一种什么样的评价度量模型训练过程中的学习好坏的方法,同时根据这个方法去实施的调整模型的参数,以期望训练的模型将来对未知的数据具有最好的预测准确度。
3.算法
算法是指模型的具体计算方法。它基于训练数据集,根据学习策略,从假设空间中选择最优模型,最后考虑用什么样的计算方法去求解这个最优模型。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。