当前位置:   article > 正文

Stable Diffusion 详解_stable diffusion 代码解读csdn

stable diffusion 代码解读csdn

整体目标

  • 文本生成图片;文本+图片生成图片
    在这里插入图片描述

网络结构

  • CLIP的文本编码器和图片生成器组成在这里插入图片描述
  • 图像生成器,输入是噪声经过UNet得到图像特征,最后解码得到图像
    在这里插入图片描述
    在这里插入图片描述

前向扩散

在这里插入图片描述
在这里插入图片描述

  • 模型直接预测图片难度比较大,所有让模型预测噪音然后输入-噪音可得到原图
    在这里插入图片描述

逆向扩散

在这里插入图片描述

预测模型UNet

在这里插入图片描述

  • 改进后的UNet
    在这里插入图片描述
    在这里插入图片描述

在这里插入图片描述
在这里插入图片描述

在这里插入图片描述

代码讲解

参考链接

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/笔触狂放9/article/detail/690445
推荐阅读
相关标签
  

闽ICP备14008679号