赞
踩
目录
回归可以用于预测多少的问题,比如预测房屋被售出价格,或者棒球队可能获得的胜场数,又或者患者住院的天数。事实上,我们也对分类问题感兴趣,不是问“多少”,而是问“哪一个”:
某个电子邮件是否属于垃圾邮件文件夹?
某个用户可能注册或不注册订阅服务?
某个图像描绘的是驴、狗、猫、还是鸡?
某人接下来最有可能看哪部电影?
通常,机器学习实践者用分类这个词来描述两个有微妙差别的问题:
这两者的界限往往很模糊。其中的一个原因是:即使我们只关心硬类别,我们仍然需要使用软类别的模型。
线性回归用一套 处理一组连续的m个样本
(的n维特征),用于拟合曲线(面)函数,预估后续函数值;
softmax回归用多套 处理每个离散样本
的n个特征,以此计算该样本属于每一类的概率,预测样本类别。
我们需要和输出一样多的仿射函数(affine function), 每个输出对应于它自己的仿射函数。
对样本的类别进行一位有效编码,将标量
如一个有三种类别的样本:{狗,猫,鸡},标签y将是一个三维向量, 其中(1,0,0)对应于“猫”、(0,1,0)对应于“鸡”、(0,0,1)对应于“狗”。
softmax函数(归一化函数)将未规范化的预测结果 变换为非负并且总和为1的概率值,同时要求模型保持可导:
尽管softmax是一个非线性函数,但softmax回归的输出仍然由输入特征的仿射变换决定。 因此,softmax回归是一个线性模型(linear model)。
补充:softmax函数求导https://zhuanlan.zhihu.com/p/37740860其中 i 为softmax的第 i 个输出,j 为softmax的第 j 个输入;当 i = j 时表明输入和输出相匹配。
推导过程如下:
Softmax回归是一个多分类的逻辑回归(解决二分类)模型:
使用交叉熵而非最小二乘法作为损失函数的优势:
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。