赞
踩
嵌入,也称为文本反转,是在 Stable Diffusion 中控制图像样式的另一种方法。在这篇文章中,我们将学习什么是嵌入,在哪里可以找到它们,以及如何使用它们。
嵌入(Embedding)是一种在机器学习和人工智能领域中常用的技术,特别是在图像生成和风格迁移等任务中。文本反转(Textual Inversion)则是一种特定于图像生成领域的方法,它允许用户在不直接修改预训练模型的情况下,通过定义新的关键字来引入新的样式或对象。
这种方法之所以受到关注,主要是因为它提供了一种高效且灵活的方式来扩展和定制AI模型的能力。尤其是在样本图像数量有限的情况下(例如只有3到5个样本),文本反转能够显著提高模型的适应性和创造力。通过这种方式,模型能够学习并模仿特定的风格或特征,并将其应用到新的图像生成过程中。
文本反转的核心思想是将特定的文本描述与图像特征相关联。这个过程通常包括以下几个步骤:
嵌入技术的优势在于其灵活性和高效性。通过文本反转,用户可以在不改变原有模型结构的前提下,快速地引入新的风格或对象。这种方法特别适用于以下场景:
总的来说,嵌入和文本反转为图像生成领域提供了一种创新的方法,使得AI模型更加灵活和易于使用。通过这种方式,我们可以更好地利用现有的AI资源,创造出更加多样化和个性化的视觉内容。
下面转载的原始研究文章中的图表说明了它是如何工作的。
在使用稳定扩散AI模型进行图像生成时,引入新的对象或样式是一个常见的需求。为了实现这一点,文本反转(Textual Inversion)提供了一种有效的方法,允许我们在不修改模型本身的情况下,通过定义新的关键字来实现这一目标。下面是详细的步骤说明:
通过这种方式,文本反转为我们提供了一种强大的工具,使得我们能够在不改变模型结构的前提下,灵活地引入新的对象或样式,极大地扩展了图像生成的可能性。这种方法不仅提高了模型的适应性和灵活性,也为艺术家和设计师提供了更多的创作自由。
下载embedding的首选位置是 Civitai。
我们在C站的右上角可以有一个filter选项:
在filter中选择model types= embedding就可以找到对应的embedding了。
在 AUTOMATIC1111 中使用embedding很容易。
首先,从 Civitai 网站下载好embedding文件。下载下来的embedding文件通常是bin或者pt结尾的。
你需要把这些embedding文件放到Stable diffusion webUI根目录下面的embeddings文件夹,然后重启Stable diffusion webUI即可。
在webUI界面,你可以在Textual Inversion中找到你安装好的embedding。
要使用他,只需要点击对应的embedding, webUI会自动把对应的embedding添加到提示词中去。比如:
a girl,0lg4kury,
这里0lg4kury就是我安装的第一个embedding的名字。点击生成,看看效果:
可以看到人物还是很相似的。
这里我用了多种采样方法来进行最终图片的对比。
之前听过我的prompt文章的朋友应该知道我们可以调整提示词强度的。
因为embedding同样也是提示词的一部分,所以我们也可以用同样的方式来调整embedding的强度。
有了正面的embedding,同样也有负面的embedding,下面是几个常用的负面embedding:
文本反转(Textual Inversion)、Dreambooth 和超网络 是三种不同的技术,它们都可以用于微调Stable Diffusion模型,但各自有不同的特点和应用场景。
总的来说,文本反转、Dreambooth和超网络各有优势和适用场景。文本反转适合快速添加新概念,Dreambooth适合个性化的高质量图像生成,而超网络则提供了一种在保留原有模型结构的同时进行微调的中间方案。用户可以根据自己的需求和资源限制来选择最合适的方法。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。