当前位置:   article > 正文

吴恩达2022机器学习专项课程(一) 6.1 动机&第三周课后实验:Lab1使用逻辑回归进行分类

吴恩达2022机器学习专项课程(一) 6.1 动机&第三周课后实验:Lab1使用逻辑回归进行分类

问题预览/关键词

  1. 回归和分类的区别?
  2. 逻辑回归的作用是?
  3. 什么是二分类问题?
  4. 二分类问题案例
  5. 如何表达二分类的结果?逻辑回归通常用哪种表达形式?
  6. 什么是正样本和负样本?
  7. 什么是阈值?
  8. 可视化线性回归解决二分类
  9. 线性回归面对二分类产生的问题
  10. 存储分类数据集
  11. 分类数据集的散点图
  12. 线性回归演示分类

笔记

1.回归和分类的区别

回归是从无限的值预测一个任意数字,而分类是从少量的值中确定一个数字。

2.逻辑回归的作用

逻辑回归用于解决二分类问题

3.二分类问题

结果只有两种可能(分类),将预测的结果分为两种结果的一种。

4.二分类问题案例

邮件是否为垃圾?金融交易是否为欺诈?肿瘤是恶性还是良性?
在这里插入图片描述

5.二分类问题的结果表达

是或否,假或真,0或1,逻辑回归通常选择0或1表示预测结果y。

6.正样本和负样本

也是一结果种表达方式,更加术语化。在判定是否为垃圾邮件时,正常邮件为负样本,垃圾邮件为正样本。正负是相对于判定的事件而言,不代表好坏。

7.阈值:

一个数值,通常选择0.5,该数值用于判断分类问题的预测结果属于0还是属于1。

8.线性回归解决二分类问题

预测值小于0.5,预测即为良性,预测值大于等于0.5,预测即为恶性。在这里插入图片描述

9.线性回归面对二分类的问题

如果新增一个训练样本,首先改变了分类方式(重新画条绿线),其次改变了我们之前预测的结论(阈值为0.5,小于0.5为良性,而此时两个小于0.5的数据点是恶性的)。在这里插入图片描述

10.分类问题数据集的存储

y通常是0或1。
在这里插入图片描述

11.数据集散点图

  • 只有一个特征和y的分布,注意y的范围在0-1,如果是线性回归问题,y的范围不止0-1。
    在这里插入图片描述
  • 两个特征与y之间的分布。-在这里插入图片描述

12.线性回归演示分类

  • 使用线性回归对x_train和y_train分类,阈值选择0.5,模型可以很好的区分恶性和良性,此时y=0.24x+(-0.10)。
    在这里插入图片描述
  • 如果增加数据,则线性回归模型的预测就会出错。在这里插入图片描述

总结

面对二分类问题,如果使用线性回归解决,在阈值选对的情况下,可能有效果。但如果二分类的数据集较为复杂,则线性回归的预测就会出现偏差,此时应该使用逻辑回归解决二分类。我们不会直接靠预测结果分类,而是设置一个阈值,然后将预测结果和阈值比较,进而将预测结果分类。本节课程演示的全是一个特征的分类,吴恩达教授只是想通过简单的例子,让大家看到线性回归用于解决分类问题的局限性。

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/菜鸟追梦旅行/article/detail/462114
推荐阅读
相关标签
  

闽ICP备14008679号