当前位置:   article > 正文

机器学习和深度学习--李宏毅 (笔记与个人理解)Day7

机器学习和深度学习--李宏毅 (笔记与个人理解)Day7

Day7 Regression Case study (预测宝可梦的cp)

Regression 可以做什么? 股票预测 自动驾驶 推荐 预测宝可梦的cp(能力类似这样的属性把)

这里突然想到,是不是可以用洛克王国和赛尔号做事情哈哈

注意: 用下标来表示某一个完整的物体的某一个部分,例如:x 表示妙蛙种子;那么 xhp 就表示它的生命值,xcp 就表示我们要预测的战斗力等等

review 做机器学习的三个步骤:

  1. 找一个model(function set 关于函数的集合)
  2. 制定评价函数好坏的指标
  3. 找一个最好的function

Example:预测宝可梦

Step1 Model

image-20240406132011823

注意这里的做法看似简单, 但是这种思想却是贯穿机器学习始末的:用简单的抽象的函数来表示我需要解决的问题

image-20240406132238667 image-20240406132408363

Step2 Goodness of function

抓取一部分的training Data 来训练我的参数

注意:这里用上标来表示一个完整的个体的编号; 在本课程中使用 y(head) y ∧ y\wedge y来表示正确的值

Loss Function : 一个函数的函数

input: a function ,output :how bad it is

image-20240406135959271

因为f 是由w 和b 来决定的

Step 3 Best Function (Gradient Descent )

找到最好的function, 也就是使得 L 最小 image-20240406140244502

这里用线性代数的方法可以直接求 ,最速下降法(Gradient Descent)更有普遍性和计算机领域的意义image-20240406140724864

how can we do better ?

select another model

image-20240406141021761 image-20240406141141038 image-20240406141204152 image-20240406141246266

个人感觉这里用多项式进行复杂函数的逼近,有一点像泰勒展开(泰勒级数)不同的点在于,这里的w 是彼此无关的,然而泰勒级数的展开式和展开点相关性极强

image-20240406141754339 image-20240406141848487

从这里可以嗅到过拟合(Overfitting)的味道啦~

Let’s collect more data

image-20240406142316561

what are the hidden factors ?

image-20240406142424125

improve the model (consider the category )

Redesign the Model

image-20240406142728924

这样的变形还是 linear model 吗?分段?

image-20240406142915546 image-20240406143046976

这里蓝色的部分就是我的feature ,本质上还是 linear model

Are there any other hidden factors?

image-20240406145137511

使用了一个比较复杂的function ,发现过拟合了

两种方案:去掉不重要的因素feature

or Regularzation (正则化)

image-20240406145503445

更加平滑; 减少 输入xi 对输出的影响; 红色的框框就是 Regularization的项

why we like the smooth ? (哎嘿~ 哈哈
声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/AllinToyou/article/detail/406429

推荐阅读
相关标签