当前位置:   article > 正文

《机器学习by周志华》学习笔记-线性模型-01

《机器学习by周志华》学习笔记-线性模型-01

1、基本形式

1.1、概念公式

给定由d个属性描述的示例x:

x=(x_{1},x_{2},...,x_{d})

其中每个属性的权重:

w=(w_{1},w_{2},...,w_{d})

其中xi是x在第i个属性上的值,线性模型试图学习一个通过属性线性作何来预测的函数,即:

f(x)=w_{1}x_{1}+w_{2}x_{2}+...+w_{d}x_{d}+b

用向量形式写成:

f(x)=w^{T}x+b

当w和b的参数学得之后,模型就可以确定。也叫「可理解性」

1.2、性质

1.2.1、优点

  • 形式简单
  • 易与建模
  • 蕴含机器学习中一些重要的基本思想
  • 功能强大的非线性模型可在线性模型的基础上引入层级结构或高维映射得到
  • 由于w直观表达了每个属性的权重,因此线性模型具有很好的可解释性。

1.2.2、案例说明

本书开头介绍了好瓜的评判标准,根据以上我们将:

好瓜模型设为:f_{g}(x),其中色泽用c表示,根蒂用r表示,敲声用s表示。则可得出好瓜模型:

f_{g}(x)=0.2x_{c}+0.5x_{r}+0.3x_{s}+1

其中权重w:

w=(w_{c},w_{r},w_{s})=(0.2,0.5,0.3)

b=1

根据上面案例,我们可以知道:

w_{r}> w_{s}> w_{c}

则意味着我们可以通过色泽c、根蒂r、以及敲声s来判断瓜是否是好瓜。

其中根蒂最要紧,其次是敲声,最后是颜色。根蒂比敲声重要,敲声比颜色重要。

2、线性回归

2.1、公式推理

给定m个样本的数据集D:

D=\left \{ (x_{1},y_{1}),(x_{2},y_{2}),...,(x_{m},y_{m}) \right \}

其中每个样本含有d个属性值。则:

x_{i}=(x_{i1},x_{i2},...,x_{id})

y_{i}\in \mathbb{R}

当属性值之间存在“序(order)”的关系,可通过连续化将其转化为连续值。

例如:

二值属性身高取值「高」「矮」,可转化为{1,0}

三值属性高度取值「高」「中」「低」,可转化为{3,2,1}

当属性值之间不存在“序(order)”的关系,可通过k个属性值用k维向量表示。

例如:

颜色属性有红、黄、蓝、绿4种,则转化为4维向量

红(1,0,0,0)

黄(0,1,0,0)

蓝(0,0,1,0)

绿(0,0,0,1) 

2.2、参数确认

2.2.1、属性值

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/花生_TL007/article/detail/449092
推荐阅读
相关标签
  

闽ICP备14008679号