当前位置:   article > 正文

李宏毅机器学习笔记-生成模型和逻辑回归_逻辑回归和生成式模型

逻辑回归和生成式模型

目录

概率生成模型

分类问题实例

模型改进

生成模型步骤总结

后验概率的数学推导

逻辑回归

逻辑回归步骤

逻辑回归和线性回归的比较

为什么不使用MSE 

判别模型 VS 生成模型

多分类

逻辑回归的限制

补充:生成式模型和判别式模型


概率生成模型

概率生成模型,简称生成模型(Generative Model),是概率统计和机器学习中的一类重要模型,指一系列用于随机生成可观测数据的模型 。生成模型的应用十分广泛,可以用来不同的数据进行建模,比如图像、文本、声音等。比如图像生成,将图像表示为一个随机向量X,其中每一维都表示一个像素值。假设自然场景的图像都服从一个未知的分布pr(x),希望通过一些观测样本来估计其分布。也就是说,生成模型考虑的是:生成样本数据的模型是什么样的(也就是样本数据具体满足什么分布/样本会以多大的概率被生成)。生成模型可以和贝叶斯概率公式进行结合,用于分类问题。

假设训练数据中有两个类别,每个类别下有5个样本,想要知道新的测试样本x属于C1类别的可能性,根据贝叶斯概率公式可以得到下图所示的概率公式。

其中,P(C1)和P(C2)表示在训练数据中,随机采样得到C1或者C2的概率,即两个类别在训练数据中所占的比重,可以由训练数据中的统计结果计算得到。分母项P(x)表示生成数据x的概率,此处可以由生成模型计算得到:P(x) = P(x|C1)P(C1) + P(x|C2)P(C2),因为有两个类别,每个类别下的数据具有不同的规律,服从不同的分布,都有可能生成数据x,所以相加得到生成x的概率(这里计算生成样本数据x的概率就是生成模型在做的事情)。

难点在于如何计算P(x|C1)和P(x|C2)。这里使用的方法是:极大似然估计。

极大似然估计就是先假设生成数据(数据分布)的模型已知(比如高斯分布),但是模型的具体参数不知(不知道高斯分布中的均值和标准差),通过已有的数据,反推最有可能(最大概率)导致这样结果的参数值。经过极大似然估计之后,可以得到每个类别下的数据满足的规律(即每个类别下的数据满足什么样的分布),那么我们就可以知道在每个类别的

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/Monodyee/article/detail/537482
推荐阅读
相关标签
  

闽ICP备14008679号