当前位置:   article > 正文

用大白话盘点AIGC文生图中的常见模型与技术概念_文生图的aigc模型

文生图的aigc模型

本文主要面向产品经理或其他非技术专业的人员,讲述其模型的基本概念与实现思路。可以作为了解当前生成模型的趋势和概念的工具,或者提供初步扫盲。对于寻求深入技术细节和如何实现的读者来说,还是建议查看相关的研究论文或文章。为了内容更加易懂,本文会牺牲一些技术细节的准确性,个人水平所限,如果有逻辑或技术原理上的错误,欢迎大佬指出(鞠躬)。

本文不会出现公式,对理解背景没有要求。如果你看过《三体》,那么恭喜你可以更好的理解高维和低维。

一、基础模型


如果我们成为了研究人员,想要实现一个机器自动生图模型,那我们需要解决四个问题:


第一个问题是:图片从哪里生成?
AE/VAE模型的答案是:图片由图片生成。
GAN、Diffsion模型的答案是:图片由噪声生成。
(CLIP在场外扯着嗓子大喊:考场内的哥哥们快选我!1+1>2,让你享受文字生图的快乐!)


第二个问题是:图片怎么生成?
AE/VAE模型的答案是:让机器学会图片的特征,就可以从特征里拼凑出一张图片。
GAN模型的答案是:随便你怎么生成,但你的东西得把我们保安(判别模型)忽悠住了才能进小区。
Diffsion模型的答案是:我让机器知道图像是怎么变成噪声的,那么机器就应该知道噪声是怎么变成图像的。


第三个问题是:怎么保证图片质量?
AE/VAE模

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/小小林熬夜学编程/article/detail/633554
推荐阅读
相关标签
  

闽ICP备14008679号