赞
踩
如果你了解 diffusion 原理的话,那么理解 Latent Diffusion Models 的原理就比较容易。论文High-Resolution Image Synthesis with Latent Diffusion Models(Latent Diffusion Models)发表于CVPR2022,第一作者是Robin Rombach(慕尼黑大学)。
论文特点在于:
LDM 的网络示意图如下所示。
图片感知压缩(Perceptual Image Compression)特点如下:
潜在扩散模型中,引入了预训练的感知压缩模型,它包括一个编码器 和一个解码器
。这样就可以利用在训练时就可以利用编码器得到
,从而让模型在潜在表示空间中学习。
下式为 DM 的目标函数:
下式为 LDM 的目标函数:
条件机制(Conditioning Mechanisms)本质在于通过交叉注意机制增强其底层 UNet 主干,将 DM 转变为更灵活的条件图像生成器,这让基于attention的模型学习多种输入模态更有效了。
Attention 计算公式如下:
其中:
训练过程分两步:
推理过程分为无条件信息和有条件信息两种情况:
没有条件信息:
有条件信息
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。