《机器学习by周志华》学习笔记-线性模型-01

作者：花生_TL007 | 2024-04-19 00:37:21

踩

1、基本形式

给定由d个属性描述的示例x：

$x=(x_{1},x_{2},...,x_{d})$

其中每个属性的权重：

$w=(w_{1},w_{2},...,w_{d})$

其中xi是x在第i个属性上的值，线性模型试图学习一个通过属性线性作何来预测的函数，即：

$f(x)=w_{1}x_{1}+w_{2}x_{2}+...+w_{d}x_{d}+b$

用向量形式写成：

$f(x)=w^{T}x+b$

当w和b的参数学得之后，模型就可以确定。也叫「可理解性」

本书开头介绍了好瓜的评判标准，根据以上我们将：

好瓜模型设为： $f_{g}(x)$ ，其中色泽用c表示，根蒂用r表示，敲声用s表示。则可得出好瓜模型：

$f_{g}(x)=0.2x_{c}+0.5x_{r}+0.3x_{s}+1$

其中权重w：

$w=(w_{c},w_{r},w_{s})=(0.2,0.5,0.3)$

$b=1$

根据上面案例，我们可以知道：

$w_{r}> w_{s}> w_{c}$

则意味着我们可以通过色泽c、根蒂r、以及敲声s来判断瓜是否是好瓜。

其中根蒂最要紧，其次是敲声，最后是颜色。根蒂比敲声重要，敲声比颜色重要。

给定m个样本的数据集D：

$D=\left \{ (x_{1},y_{1}),(x_{2},y_{2}),...,(x_{m},y_{m}) \right \}$

其中每个样本含有d个属性值。则：

$x_{i}=(x_{i1},x_{i2},...,x_{id})$

$y_{i}\in \mathbb{R}$

当属性值之间存在“序(order)”的关系，可通过连续化将其转化为连续值。

例如：

二值属性身高取值「高」「矮」，可转化为{1,0}

三值属性高度取值「高」「中」「低」，可转化为{3,2,1}

当属性值之间不存在“序(order)”的关系，可通过k个属性值用k维向量表示。

例如：

颜色属性有红、黄、蓝、绿4种，则转化为4维向量

红(1,0,0,0)

黄(0,1,0,0)

蓝(0,0,1,0)

绿(0,0,0,1)

声明：本文内容由网友自发贡献，不代表【wpsshop博客】立场，版权归原作者所有，本站不承担相应法律责任。如您发现有侵权的内容，请联系我们。转载请注明出处：https://www.wpsshop.cn/w/花生_TL007/article/detail/449092