当前位置:   article > 正文

Stable Diffusion入门系列之安装_安装stable diffusion

安装stable diffusion

1、什么是 Stable Diffusion

  我们小时候经常训练看图说话,即给定一张图,用自己的语言描述图像中包含的内容。与之相反,Stable Diffusion 是一种根据文字描述生成对应图像的模型。那么它是如何实现的呢?网络上的很多文章从数学原理上进行介绍,虽然更为准确,但是对读者的理论基础要求会更高一些。对于没有接触过人工智能算法的读者们,可能看的云里雾里。因此,笔者准备用更为浅显的语言解释一下基本原理,更专业的理论会在后续进行进一步介绍。

  首先大家想象一下如何教儿童认识世界,我们通常会购买一些画本,上面有很多图,然后还有图所对应的内容,我们会一遍一遍的告诉他们每张图是什么内容。当儿童熟悉了画本上的内容之后,我们通常会有进一步的测试,比如问“灯在哪儿呢”或者“车在哪儿呢”,这个时候他们就会在自己的脑海中检索灯或者车的形状,并与现实世界的物体进行对应,如果能够成功指出灯或者车的位置,说明他们已经建立了灯和车的概念,如果他们掌握了绘画技能,就可以顺利地绘制出灯和车的图案了。

  类比儿童认识世界的过程,我们可以认为stable diffusion是一个具有绘画技能的儿童,但是并不知道灯或者车的概念,于是我们的主要任务是要让它形成相关的概念,这样它就可以进行图像绘制了。因此,我们通常需要不断地向stable diffusion 展示灯或者车的图像,这一过程就称为训练过程,当stable diffusion 建立好相关的概念之后,我们就可以让它绘制已知概念的物体或者场景了,这一过程通常被称为推理或者测试过程。

  在训练完成stable diffusion模型后会得到权重文件,不同的权重文件擅长的方向不一样,究其原因,主要是在训练过程中展示的图片存在差异,导致不同的权重文件建立的概念有差异,进而影响绘画质量。可以简单的理解为不同的儿童接受的训练不一样,导致其特长也有所不同,有的擅长运动,有的擅长琴棋书画。因此,有的权重文件画建筑更逼真,有的画人物更传神,需要针对你的任务目标选择合适的权重文件,否则难以充分发挥其优势。

  那么权重文件如何获取呢?主要有以下两个途径:

  1. 自己收集图片并进行描述,再训练stable diffusion,这种方法得到的权重文件会更擅长指定的任务,但是耗费的时间比较久;
  2. 使用别人训练好的权重文件,可以从哩布哩布等网站下载。

2、Stable Diffusion 安装

2.1 配置要求

  在安装之前,首先看一下如下图所示的stable diffusion的基本配置需求,越高的配置处理能够处理越高分辨率的图像,同时处理的速度也会更快。其中最重要的就是显卡与显存,优先选择NVIDIA的显卡,与软件的兼容性更好。至于显卡的计算能力与显存的重要性,如果预算足够就可以兼顾,否则建议优先选择显存高的显卡。打个不太恰当的比方,显卡的计算能力就像是人绘画的速度,显存像画布,绘画的速度慢一点可以多花些时间,画布的尺寸则制约着作品的最大尺寸,无法绘制超过画布尺寸的图像。显存较小的时候在绘制高分辨率的图像时容易出现“out of memory(OOM)”错误。
配置要求

2.2 安装

  满足配置要求之后,建议下载秋叶大佬的整合包,包含了基本的安装包和常用的权重文件。下载好之后放置在相应的位置中,路径建议全英文与数字,避免报错。文件夹中包含以下内容:
文件夹内容
  首先需要安装运行依赖,双击“启动器运行依赖-dotnet-6.0.11.exe”进行安装,如下图所示:
安装依赖
  点击安装,等待安装完成。
安装成功
  安装完成之后,解压"sd-webui-aki-v4.2.7z"文件至当前目录,等待解压完成。
解压文件
  解压完成后,进入"sd-webui-aki-v4.2"文件夹中,找到"A启动器.exe"文件,双击打开。
A启动器
  启动器会进行进一步的配置,配置好后会自动进入启动器。
A启动器1A启动器2
  此时可以点击一键启动按钮,也可以在左侧进行模型或者版本管理。此处我们可以看一下,默认是1.3.2的版本,最新版是1.5.1,我们可以手动切换一下,速度还是挺快的。
version
  切换完版本之后,我们点击一键启动按钮启动webUI。第一次运行时会进行依赖安装,安装成功之后再使用就不会重复安装了。
webui_requirements
  安装完成之后会自动打开浏览器,显示以下界面,至此,webUI安装完成。
webui

3、测试

  下面我们简单的画一张图体验一下具体的操作流程。首先我们需要在正向提示词的文本框中填入想要生成的内容,注意目前大部分模型只支持英文输入,也有部分模型支持中文输入,大家根据语言需要进行选择,此处我们以英文模型为例,我们希望模型绘制如下场景:夕阳下,一个平静的村庄,一条小河在村庄中缓缓流过,一座小桥坐落在河上。于是,我们输入如下内容,点击生成按钮,等待结果。
test
  最终我们得到了如下的图像,可以看出,河流、夕阳以及桥梁都有了,缺少了村庄,因此我们需要对提示词进行进一步修改才能得到想要的结果,具体内容会在下一讲中详细介绍。
results

4、总结

  Stable Diffusion 是一种开源的根据文字描述生成对应图像的模型,要想生成符合自己预期的内容,首先需要选择合适的权重文件,其次需要精心撰写提示词,最后通过反复调试得到满意的结果。

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/不正经/article/detail/121517
推荐阅读
相关标签
  

闽ICP备14008679号