赞
踩
机器学习三要素
在学习算法时,根据机器学习三要素的大框架,确定模型是什么以及有哪些策略及算法。
3.2 线性回归
3.2.1 算法原理:线性模型,对输入样例各个特征进行线性加权得到预测的输出。
关于特征量化 对于离散特征,
3.2.2 策略(损失函数)
得出同样的损失函数(均方误差)(公式3.4):
3.3.3 求解w,b
可证明线性回归的目标函数是一个凸函数,利用凸函数求最值的思路解得w和b,即公式3.7。
多线性回归:向量化Ew。
3.3 对数几率回归
3.3.1 算法原理:在线性模型的基础上套一个映射函数来实现分类功能。输出值范围为[0,1],近似阶跃的单调可微函数即sigmoid函数。
3.3.2 策略(损失函数)
得出同样的公式3.27:
3.3.3 算法:梯度下降,牛顿法(之后)。
3.4 线性判别分析
3.4.1 算法原理:找到投影方向,使得全体训练样本在该方向上投影后,
3.4.2 策略(损失函数)
3.4.3 求解w(拉格朗日乘子法)
3.5 多分类学习
很多二分类模型可以直接推广到多分类的情况。更多情形下,我们是利用二分类器解决多分类问题,这一过程涉及到对多分类任务进行拆分,以及对多分类器进行集成。
3.6 类别不平衡问题
类别不平衡问题:训练集内正类数目和负类数目相差悬殊。
解决办法:
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。