赞
踩
为了更好的理解扩散模型,我们首先需要理解生成模型。人工智能生成内容(AI Generated Content,AIGC)近年来成为了非常前沿的一个研究方向,生成模型目前有四个流派,分别是
生成对抗网络(Generative Adversarial Models,GAN):生成对抗网络GAN通过一种生成对抗式的方式进行学习,其生成器G根据潜在空间的采样z生成图像x’,判别器D 则判断输入图像是真实图像x 还是生成图像x’
变分自编码器(Variance Auto-Encoder,VAE):变分自编码器VAE通过编码器学习图像分布p(x)到先验分布p(z)之间的转换,解码器学习p(z)到p(x)的转换关系,其在数学上可以被视为通过最大化ELBO进行优化;
标准化流模型(Normalization Flow,NF):标准化流模型则是通过构造一个可逆的变换,建立图像分布p(x)与某个已知分布p(z)的变换;
扩散模型(Diffusion Models,DM):其通过逐步增加高斯噪声将其变为纯高斯噪声z zz,再通过对z zz逐步去噪生成新的图像
它们之间的主要差异在于建模方式
下面一幅图说明生成模型下面有多种生成方法
扩散模型是在2015年提出的,其动机来自非平衡态热力学。
扩散模型是一种生成模型,它通过模拟随机扩散过程,逐渐将随机噪声转变为目标数据分布,从而生成新的数据样本。
简单地说,扩散模型就分为两个过程:“加噪”和“去噪”(也称为前向过程和逆向过程)。
基于扩散模型的实例架构有GLIDE、DALLE-2、Imagen和完全开源的稳定扩散。
扩散模型由正向过程和反向过程这两部分组成,对应VAE中的编码和解码。在正向过程中,输入x0 会不断混入高斯噪声。经过T 次加噪声操作后,图像 xT 会变成一幅符合标准正态分布的纯噪声图像。而在反向过程中,我们希望训练出一个神经网络,该网络能够学会 T 个去噪声操作,把xT 还原回 x0。网络的学习目标是让 T 个去噪声操作正好能抵消掉对应的加噪声操作。训练完毕后,只需要从标准正态分布里随机采样出一个噪声,再利用反向过程里的神经网络把该噪声恢复成一幅图像,就能够生成一幅图片了。
图像生成网络会学习如何把一个向量映射成一幅图像。设计网络架构时,最重要的是设计学习目标,让网络生成的图像和给定数据集里的图像相似。VAE的做法是使用两个网络,一个学习把图像编码成向量,另一个学习把向量解码回图像,它们的目标是让复原图像和原图像尽可能相似。学习完毕后,解码器就是图像生成网络。扩散模型是一种更具体的VAE。它把编码过程固定为加噪声,并让解码器学习怎么样消除之前添加的每一步噪声。
标题 | 链接 |
---|---|
扩散模型 | https://zh.wikipedia.org/wiki/%E6%89%A9%E6%95%A3%E6%A8%A1%E5%9E%8B |
扩散模型 | https://www.zhihu.com/question/26573810 |
一文详解扩散模型:DDPM | https://baijiahao.baidu.com/s?id=1761690033077829913&wfr=spider&for=pc |
人工智能中的扩散模型——你需要知道的一切 | https://www.unite.ai/zh-CN/diffusion-models-in-ai-everything-you-need-to-know/ |
一文速览扩散模型优化过程:从DDPM到条件生成模型Stable Diffusion | https://blog.csdn.net/qq_36560894/article/details/130851385 |
扩散模型的工作原理:从零开始的数学 | https://zhuanlan.zhihu.com/p/599538060 |
扩散模型:方法与应用综述(Diffusion Models: A Comprehensive Survey of Methods and Applications)金鱼马 | https://zhuanlan.zhihu.com/p/573627573 |
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。