赞
踩
机器学习是一种通过先验信息来提升模型能力的方式。具体地说,对于给定的任务和性能度量标准,使用先验信息,通过某种计算方式改进初始模型,获得一个性能更好的改进模型。
机器学习致力于研究如何通过计算的手段,利用经验来改善系统自身的性能,从而在计算机上从数据中产生“模型”,用于对新的情况给出判断
输出为连续值
如瓜的成熟度
输出为离散值
二分类:好瓜、坏瓜
多分类:南瓜、西瓜、冬瓜
无标记信息
如根据瓜的外观分成两部分
有标记信息:分类、回归
无标记信息:聚类、降维
环境的反馈:马尔科夫决策过程
机器学习的目标是使得学到的模型能很好的适用于“新样本”,而不仅仅是训练集合,我们称模型适用于新样本的能力为泛化(generalization)能力
对于一个具体的回归或分类任务,所有可能的模型输入数据组成的集合称为输入空间,所有可能的模型输出数据构成的集合称为输出空间
回归或分类机器学习任务的本质就是寻找一个从输入空间到输出空间的映射,并将该映射作为预测模型
从输入空间到输出空间的所有可能映射组成的集合称为假设空间
机器学习模型的输出结果与其对应的真实值之间往往会存在一定的差异,这种差异被称为模型的输出误差,简称为误差
损失函数度量模型一次预测的好坏
风险函数度量平均意义下模型预测的好坏。
过拟合是同时拟合训练样本的共性特征和个性特征(噪声)
欠拟合是未能充分拟合训练样本共性特征造成模型泛化误差较大而导致模型泛化能力较弱
感知机、朴素贝叶斯模型、支持向量机、决策树、随机森林…
线性回归、逻辑回归、Softmax回归…
神经网络…
经验风险最小化
损失函数
梯度下降法
反向传播算法
动态规划算法
…
–输入为实例的特征向量,输出为实例的类别,取+1和-1
–感知机对应于输入空间中将实例划分为正负两类的分离 超平面
–导入基于误分类的损失函数 –利用梯度下降法对损失函数进行极小化
–感知机学习算法具有简单而易于实现的优点
–1957年由Rosenblatt提出,是神经网络与支持向量机的 基础
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。