用大白话盘点AIGC文生图中的常见模型与技术概念_文生图的aigc模型

作者：小小林熬夜学编程 | 2024-05-27 19:03:44

踩

文生图的aigc模型

本文主要面向产品经理或其他非技术专业的人员，讲述其模型的基本概念与实现思路。可以作为了解当前生成模型的趋势和概念的工具，或者提供初步扫盲。对于寻求深入技术细节和如何实现的读者来说，还是建议查看相关的研究论文或文章。为了内容更加易懂，本文会牺牲一些技术细节的准确性，个人水平所限，如果有逻辑或技术原理上的错误，欢迎大佬指出（鞠躬）。

本文不会出现公式，对理解背景没有要求。如果你看过《三体》，那么恭喜你可以更好的理解高维和低维。

一、基础模型

如果我们成为了研究人员，想要实现一个机器自动生图模型，那我们需要解决四个问题：

第一个问题是：图片从哪里生成？
AE/VAE模型的答案是：图片由图片生成。
GAN、Diffsion模型的答案是：图片由噪声生成。
（CLIP在场外扯着嗓子大喊：考场内的哥哥们快选我！1+1>2，让你享受文字生图的快乐！）

第二个问题是：图片怎么生成？
AE/VAE模型的答案是：让机器学会图片的特征，就可以从特征里拼凑出一张图片。
GAN模型的答案是：随便你怎么生成，但你的东西得把我们保安（判别模型）忽悠住了才能进小区。
Diffsion模型的答案是：我让机器知道图像是怎么变成噪声的，那么机器就应该知道噪声是怎么变成图像的。

第三个问题是：怎么保证图片质量？
AE/VAE模

声明：本文内容由网友自发贡献，不代表【wpsshop博客】立场，版权归原作者所有，本站不承担相应法律责任。如您发现有侵权的内容，请联系我们。转载请注明出处：https://www.wpsshop.cn/w/小小林熬夜学编程/article/detail/633554