赞
踩
回归是从无限的值预测一个任意数字,而分类是从少量的值中确定一个数字。
逻辑回归用于解决二分类问题。
结果只有两种可能(分类),将预测的结果分为两种结果的一种。
邮件是否为垃圾?金融交易是否为欺诈?肿瘤是恶性还是良性?
是或否,假或真,0或1,逻辑回归通常选择0或1表示预测结果y。
也是一结果种表达方式,更加术语化。在判定是否为垃圾邮件时,正常邮件为负样本,垃圾邮件为正样本。正负是相对于判定的事件而言,不代表好坏。
一个数值,通常选择0.5,该数值用于判断分类问题的预测结果属于0还是属于1。
预测值小于0.5,预测即为良性,预测值大于等于0.5,预测即为恶性。
如果新增一个训练样本,首先改变了分类方式(重新画条绿线),其次改变了我们之前预测的结论(阈值为0.5,小于0.5为良性,而此时两个小于0.5的数据点是恶性的)。
y通常是0或1。
面对二分类问题,如果使用线性回归解决,在阈值选对的情况下,可能有效果。但如果二分类的数据集较为复杂,则线性回归的预测就会出现偏差,此时应该使用逻辑回归解决二分类。我们不会直接靠预测结果分类,而是设置一个阈值,然后将预测结果和阈值比较,进而将预测结果分类。本节课程演示的全是一个特征的分类,吴恩达教授只是想通过简单的例子,让大家看到线性回归用于解决分类问题的局限性。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。