赞
踩
目录
统计学习是关于计算机基于数据构建概率统计模型并运用模型对数据进行预测与分析的一门学科。也可以说统计学习就是计算机系统通过运用数据及统计方提高系统性能的机器学习。故统计学习也称为统计机器学习。
统计学习的目的在于从假设空间中选取最优模型。
统计学习的对象是数据,数据分为由连续变量和离散变量表示的类型,其中同类数据是指具有某种共同性质的数据。在统计学习的过程中,以变量或者是变量组表示数据。
统计学习的方法是基于数据构建统计模型从而对数据进行预测与分析。
统计学习方法包括模型的假设空间、模型选择的准则以及模型学习的算法。统计学习方法的三要素:模型、策略、算法
统计学习由监督学习(supervised learning)、非监督学习(unsupervised learning)、半监督学习(semi-supervised learning)和强化学习(reinforcement learning)等组成。
统计学习可以基本分类分为监督学习、无监督学习、强化学习、半监督学习、主动学习等。
从标注数据中学习预测模型的机器学习问题,标注数据表示输入输出的对应关系,预测模型对给定输入产生相应的输出
本质:学习输入到输出的映射的统计规律
相关概念:
任务分类:
联合概率分布
假设空间
问题形式化
定义
问题形式化
定义
r是奖励函数(reward function) :
γ是衰减系数(discount factor ) : γ ∈ [0,1]
概率模型:决策树、贝叶斯网络、马尔科夫随机场、条件随机场、概率潜在语义分析、潜在狄利克雷分配、高斯混合模型
非概率模型:感知机、支持向量机、k近邻、AdaBoost、K均值、潜在语义分析、神经网络
统计学习模型根据算法分为在线学习和批量学习。
上面说到统计学习方法都是由模型、策略和算法构成的,所以三要素可以简单的表示为以下形式:
方法=模型+策略+算法
模型就是所要学习的条件概率分布或者决策函数。
统计学习方法总结为最优化问题。
算法是指线性模型的具体计算方法。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。