赞
踩
本文主要面向产品经理或其他非技术专业的人员,讲述其模型的基本概念与实现思路。可以作为了解当前生成模型的趋势和概念的工具,或者提供初步扫盲。对于寻求深入技术细节和如何实现的读者来说,还是建议查看相关的研究论文或文章。为了内容更加易懂,本文会牺牲一些技术细节的准确性,个人水平所限,如果有逻辑或技术原理上的错误,欢迎大佬指出(鞠躬)。
本文不会出现公式,对理解背景没有要求。如果你看过《三体》,那么恭喜你可以更好的理解高维和低维。
如果我们成为了研究人员,想要实现一个机器自动生图模型,那我们需要解决四个问题:
第一个问题是:图片从哪里生成?
AE/VAE模型的答案是:图片由图片生成。
GAN、Diffsion模型的答案是:图片由噪声生成。
(CLIP在场外扯着嗓子大喊:考场内的哥哥们快选我!1+1>2,让你享受文字生图的快乐!)
第二个问题是:图片怎么生成?
AE/VAE模型的答案是:让机器学会图片的特征,就可以从特征里拼凑出一张图片。
GAN模型的答案是:随便你怎么生成,但你的东西得把我们保安(判别模型)忽悠住了才能进小区。
Diffsion模型的答案是:我让机器知道图像是怎么变成噪声的,那么机器就应该知道噪声是怎么变成图像的。
第三个问题是:怎么保证图片质量?
AE/VAE模
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。