赞
踩
Stable Diffusion是一种文本到图像的潜在扩散模型,由CompVis、Stability AI和LAION的研究人员和工程师共同创建。它使用来自LAION-5B数据库子集的512x512图像进行训练,能够生成包括人脸在内的任何图像。
该模型不是在高维图像空间中操作,而是首先将图像压缩到潜空间(latent space)中,通过在潜空间中应用扩散过程来生成新的图像。Stable Diffusion能够从文本描述中生成详细的图像,并可用于图像修复、图像绘制、文本到图像和图像到图像等任务。具体来说,只要给出想要的图片的文字描述,Stable Diffusion就能生成符合要求的逼真图像。
Stable Diffusion将“图像生成”过程转换为逐渐去除噪声的“扩散”过程。这个过程从随机高斯噪声开始,经过训练逐步去除噪声,直到不再有噪声,最终输出更贴近文本描述的图像。
有人可能会问,目前很多文生图的软件,比如:Midjourney、文心一言,为什么还要本地部署,在使用多种绘图软件后,我认为Stable Diffusion本地部署的理由如下:
源码安装的方式,推荐有一定开发基础的同学尝试,对开发不懂的请看下一章节"SD一键安装包安装",其源码仓库地址如下:
GitHub - AUTOMATIC1111/stable-diffusion-webui: Stable Diffusion web UI
该仓库提供的基于Web的用户界面是一个极大的便利,因为它显著简化了使用Stable Diffusion这一模型的过程。通过Web界面,用户无需深入了解复杂的命令行操作或编程知识,即可轻松地进行图像生成、模型训练和其他相关任务。
源码的安装不是本文的重点,因为源码里面已经提供了非常详细的安装教程(如下图),本文不再复述。
下一章节中,详细教大家如何使用一键安装包的方式快速安装Stable Diffusion。
打开下载链接下载软件包。下载完成后,将压缩包解压至D盘或E盘(切记避免C盘)。可提前创建一个名为“Stable Diffusion”的文件夹,将解压内容放入其中。
接下来,运行依赖启动器,双击运行依赖项(启动器运行依赖-dotnet-6.0.11.exe),依赖安装完成,解压sd-webui-aki-v4.6.1.7z这个压缩包,解压后的内容如下:
双击启动器,出现如下界面:
点击一键启动后,让SD启动器自动加载,首次启动可能稍慢,稍等一会就可以了。
当出现后台输出窗口这个信息时,恭喜你!Stable Diffusion已成功安装!现在,你可以尽情探索其强大功能,感受AI绘图的魅力!
在浏览器中输入:http://127.0.0.1:7860/?__theme=dark,如果上一步安装成功,浏览器也会自动打开这个界面。
使用默认参数画个猫试试效果,在提示词输入框中输入:a cat 然后点击生成。
默认是二次元效果,效果还不错,使用熟练后还可以添加更多的提示词。
在提示词框中输入:1girl 在看看效果:
换个写实模型,画美女试试(关注我,后续有彩蛋):
Stable Diffusion的应用场景非常广泛,尤其在图像生成和处理领域。以下是一些主要的应用场景:
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。