赞
踩
监督学习是指从给定的训练数据集中学习出一个函数(模型参数),当新的数据到来时,可以根据这个函数预测结果。监督学习的训练集要求包括输入输出,即特征和标签。数据集中每个样本都有相应的 “正确答案(标签)”,根据这些样本做出预测。
所有的分类和回归算法都属于监督学习。回归和分类算法的区别在于输出变量的类型:定量输出称为回归(连续型、数值型变量预测)、定性输出称为分类(离散变量、标称型变量预测)。
输入:有标签
输出:有反馈
目的:预测结果
案例:学认字
算法:分类、回归
无监督学习是指输入数据没有标记(标签),样本数据类型未知,需要根据样本间的相似性对样本集进行聚类。学习模型是为了推断出数据的一些内在结构,目标是:使类内差距最小化,类间差距最大化。
输入:无标签
输出:无反馈
目的:发现潜在结构
案例:自动聚类
算法:聚类、降维
半监督学习:训练集同时包含有标记样本数据和未标记样本数据。
在此学习方式下,输入数据部分被标识,部分没有被标识,这种学习模型可以用来进行预测,但是模型首先需要学习数据的内在结构以便合理的组织数据来进行预测。应用场景包括分类和回归,算法包括一些对常用监督式学习算法的延伸。
半监督学习试图对未标识数据进行建模,在此基础上再对标识的数据进行预测。
输入:训练样本 Data 和待分类的类别
输出:训练样本有无标签均可
目的: 训练数据量过时
监督学习效果不能满足需求,因此用来增强效果
强化学习的本质是 make decisions 的问题,即自动进行决策。目标是:获得最多的累计奖励。
在这种学习模式下,输入数据作为模型的反馈,而不是监督模型那样(输入数据仅仅是检查模型对错的方式)。在强化学习下,输入数据直接反馈到模型,模型必须对此立刻做出调整。常见的应用场景包括动态系统以及机器人控制等。
输入:决策流程及激励系统
输出:一系列行动
目的:长期利益最大化,回报函数(只会提示你是否朝着目标方向前进的延迟反应)
案例:学下棋
算法:马尔可夫决策,动态规划
(参考:机器学习之KNN(k近邻)算法详解)
(参考:机器学习算法分类)
(参考:[Machine Learning] 机器学习常见算法分类汇总)
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。