空白诗007

这个屌丝很懒，什么也没留下！

热门标签

第2章 stablediffusion基本参数设置与应用_stablediffusion迭代步数设置多少

作者：空白诗007 | 2024-07-21 06:16:31

踩

stablediffusion迭代步数设置多少

第2章 stablediffusion基本参数设置与应用

2.1 文生图的基本参数

2.1.1 【实战】：设置迭代步数

迭代步数（Steps）是指输出画面需要的步数，其作用可以理解为“控制生成图像的精细程度”，Steps越高生成的图像细节越丰富、精细。不过，增加Steps的同时也会增加每个图像的生成时间，减少Steps则可以加快生成速度。

（下图是迭代步数20和25和30的区别）

2.1.2 【实战】：设置采样方法

Stable Diffusion 中的采样方法是指模型在生成图像时所使用的算法，不同的采样方法会影响生成图像的质量、速度和收敛性。以下是一些常见的采样方法：

Euler a：一种基于欧拉方法的采样器，20-30 步就能生成效果不错的图片，是一种比较快速的采样方法。

Euler：经典的欧拉采样方法，生成的图片效果较好，但速度较慢。

LMS：一种线性多步采样方法，适用于需要较高精度的情况。

Heun：欧拉的一个更准确但较慢的版本，耗费时间接近 Euler 的 2 倍。

DPM2：一种基于扩散概率模型的采样方法，能够生成高质量的图像。

DPM2 a：DPM2 的改进版本，在一些情况下可能会产生更好的效果。

DPM++ 2S a：DPM++的一种采样方法，通常可以生成较为清晰的图像。

DPM++ 2M：DPM++的另一种采样方法，可能在某些情况下表现更好。

DPM++ SDE：一种基于随机微分方程的采样方法，适用于对图像质量要求较高的情况。

DPM fast：一种快速的采样方法，适合对速度要求较高的场景。

DPM adaptive：一种自适应的采样方法，可以根据图像的特点自动调整采样参数。

DPM2 ：可能会提高图像质量。

DPM2 a ：可能会进一步改善效果。

DPM++ 2S a：可能会提高图像的清晰度和细节。

DPM++ 2M ：可能会在某些情况下产生更好的效果。

DPM++ SDE ：可能会提高图像质量。

DDIM：一种确定性的采样方法，速度较快，但可能会损失一些图像质量。

PLMS：一种渐进式的采样方法，可以逐步提高图像质量。

UniPC：一种新的采样方法，在 2023 年被提出，具有较好的兼容性和效果。

在选择采样方法时，需要考虑以下因素：

图像质量：不同的采样方法会对生成的图像质量产生影响。一般来说，更复杂的采样方法可能会生成更高质量的图像，但也可能需要更长的计算时间。
计算效率：一些采样方法可能比其他方法更快，这对于需要快速生成图像的情况很重要。
收敛性：某些采样方法可能更容易收敛到稳定的图像，而其他方法可能需要更多的迭代次数。
应用场景：不同的采样方法可能适用于不同的应用场景，例如生成写实图像或抽象图像。

通常，在实际应用中，可以尝试不同的采样方法，并根据具体需求和效果选择最适合的方法。此外，还可以调整采样步数等参数来进一步优化生成的图像。

2.1.3 面部修复与高分辨率修复的作用

面部修复所用到的插件打开stable diffusion工具栏【扩展】-【可下载】搜索adetailer插件并安装。安装后效果：

然后展开Adetailer插件栏进行参数设置：

推荐使用：face_yolov8n_v2.pt对二次元人物和真人人物同时有效：

下面我们对这张图片进行修复设置：

第一步：打开单元一选项，选择整体修复选项person_yolov8n-seg.pt

第二步：打开单元二选择脸部修复选项face_yolov8n_v2.pt，同时在正向提示词中输入：detail face（详细的脸）

第三步：打开单元三选择手部修复选项hand_yolov8n.pt

点击生成看最后生成效果：

（最终效果）

Adetailer能控制脸部，手部，整体部分，根据提示词功能可以得到以下效果：

在正向提示词中输入smiling face（笑脸），anger（生气）

反向提示词中输入ugly（丑陋）出现以下效果对比：

（图1 没有提示词效果）

（图2 输入笑脸提示词效果）

（图3输入生气提示词效果）

2.1.4 【实战】：设置图片尺寸

图片尺寸即分辨率，指的是图片宽和高的像素数量，它决定了数字图像的细节再现能力和质量。

将生成图片尺寸改为512x768

2.1.5 【实战】：设置总批次数与单批数量

总批次1，单批次数量4，一批生成4张图片。

同理总批次4，单批次数量4，一批生成16张图片。

2.1.6 【实战】：设置提示词引导系数

提示词引导系数（CFG Scale）是 Stable Diffusion 中的一个参数，用于控制提示词对生成图像的影响程度。它的值越大，提示词对生成图像的影响就越大，生成的图像就会更接近提示词的描述；反之，值越小，提示词的影响就越小，生成的图像就会更具随机性。

下面实例是提示词4和11的对比

2.2 掌握随机数种子的用法

当值为-1时表示随机生成图像，固定种子值图片整体风格不会改变。

下图为固定种子值。改变提示词引导值效果。（图1）（图2）

（图1）

（图2）

下面实例为随机种子值效果，不改变任何参数，看效果：

变异种子参数设置：固定原始随机种子，变异种子数值越大图像发生变化越大（变异强度数值）

2.3 高分辨率修复

高分辨率修复也是使图像清晰的一种方法，就是在原图基础成倍数扩大像素：使图像细节更完美。

在Stable Diffusion中，高分辨率放大算法的参数包括放大倍数、重绘幅度、高清采样次数和放大算法等，各项参数的说明如下：

放大倍数：指放大到原图的多少倍，也可以按照参数后面手动设置新图像的宽和高。
重绘幅度：指和原图的差异度，一般推荐0.5，安全放大区间0.3-0.5，具有自由度区间0.5-0.7。
高清采样次数：指和采样迭代数一样，不用选择，保持默认0的迭代次数。

常用的放大算法包括：

R-ESRGAN 4x+：这是一种流行的放大算法，适用于写实图片；
R-ESRGAN 4x+Anime6B：适用于二次元类图片或二三次元混合图片；
4x-UltraSharp：基于ESRGAN做了优化，可将图像分辨率提升4倍，在提高分辨率的同时保持或增强图像的细节、清晰度和逼真度；
BSRGAN：一种专门针对盲图像超分辨率问题的生成式对抗网络模型；
ESRGAN系列：一种先进的深度学习模型，包含一个生成器和一个判别器，生成器负责从低分辨率图像中生成高分辨率图像，而判别器则用于判断生成的高分辨率图像与真实高分辨率图像之间的差异，二者通过对抗训练共同优化。

（上图变化效果不太明显）

2.4 正向提示词，反向提示词应用

Stable Diffusion提示词里面的各种符号，到底是什么意思？面对复杂的stable diffusion关键词，你是否也无从下手呢？这个教程给大家详细讲解stablediffusion提示词各种符号的意义，进阶语法和提示词必装插件。

画质词：(masterpiece:1.2), best quality, highres,extremely detailed CG,perfect lighting,8k wallpaper,

真实系:photograph, photorealistic,

插画风:Illustration, painting, paintbrush,

二次元:anime, comic, game CG,

3D:3D,C4D render,unreal engine,octane render,

负面词：NSFW, (worst quality:2), (low quality:2), (normal quality:2), lowres, normal quality, ((monochrome)),((grayscale)), skin spots, acnes, skin blemishes, age spot, (ugly:1.331), (duplicate:1.331), (morbid:1.21), (mutilated:1.21), (tranny:1.331), mutated hands, (poorly drawn hands:1.5), blurry, (bad anatomy:1.21), (bad proportions:1.331), extra limbs, (disfigured:1.331), (missing arms:1.331), (extra legs:1.331), (fused fingers:1.5), (too many fingers:1.5), (unclear eyes:1.331), lowers, bad hands, missing fingers, extra digit,bad hands, missing fingers, (((extra arms and legs))),

NSFW，(最差质量:2)，(低质量:2)，(正常质量:2)，(低质量:2)，((单色))，((灰度))，皮肤斑点，痤疮，皮肤瑕疵，老年斑，(丑陋:1.331)，(重复:1.331)，(病态:1.21)，(残缺:1.21)，(变形:1.331)，变异手，(画得不好的手:1.5)，模糊，(解剖不良:1.21)，(比例不良:1.331)，多余的四肢，(毁容:1.331)，(缺胳膊:1.331)，(多余的腿:1.331)，(融合的手指:1.5)，(过多的手指:1.5)，(不清晰的眼睛:1.331)，低质量，坏的手，少了手指，多了手指，手不好，少了手指，多了胳膊和腿

在所有参数不变情况下，我们输入负向提示词：得到以下图片结果：

网络中有很多大佬已经训练成熟的反向提示词模型：Embedding模型

本文内容由网友自发贡献，转载请注明出处：【wpsshop博客】