赞
踩
#引言
机器学习可以从不同的视角进行理解和分析,其中两种主要的视角是频率视角和贝叶斯视角
频率视角下的机器学习是基于经典统计学原理的,它主要关注的是数据的频率或概率。当重复试验的次数趋近于无穷大时,事件发生的频率会收敛到真实的概率之上
频率统计理论的核心在于认定待估计的参数是固定不变的常量,讨论参数的概率分布是没有意义的;而用来估计参数的数据是随机的变量,每个数据都是参数支配下一次独立重复试验的结果。由于参数本身是确定的,那频率的波动就并非来源于参数本身的不确定性,而是由有限次观察造成的干扰而导致,主要使用最大似然估计法,让数据在给定参数下的似然概率最大化;频率视角对应机器学习中的统计学习,以经验风险最小化作为模型选择的准则
频率主义解决统计问题的基本思路如下:参数是确定的,数据是随机的,利用随机的数据推断确定的参数,得到的结果也是随机的
参数确定,数据随机
贝叶斯视角下的机器学习是基于贝叶斯统计学原理的,它将概率视为对不确定性的量化,并且允许我们更新我们对参数的信念,概率表示的是客观上事件的可信程度(degree of belief),也可以说成是主观上主体对事件的信任程度,它是建立在对事件的已有知识基础上的
待估计的参数视为随机变量,用来估计的数据反过来是确定的常数,讨论观测数据的概率分布才是没有意义的,相对于频率主义的最大似然估计,贝叶斯主义在参数估计中倾向于使后验概率最大化,使用最大后验概率估计(maximum a posteriori estimation)
将先验概率和后验概率关联起来,使用最大后验概率估计
数据确定,参数随机
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。