赞
踩
Stable Diffusion是一种基于深度学习的生成模型,主要用于文本到图像的转换。Stable Diffusion 的厉害之处在于它可以在运行于大多数配备有合适 GPU 的个人计算机上,而且,它开源了项目代码和模型权重。这样一来,开发者就可以在它的基础上进行二次开发、做插件、做工具,这就有了如今结合 Stable Diffusion 流行起来的 Stable Diffusion WebUI、LoRA、ControlNet 等开源项目。这就相当于给 Stable Diffusion 的发展增加了大量的盟友,极大地丰富了它的功能和特性,也被广泛应用于艺术创作、媒体和广告行业。
Stable Diffusion技术的基础可以追溯到1990年代初,由Perona和Malik提出的非线性扩散方程开始。这种方法通过改变传统线性扩散模型的处理方式,使得具有较小梯度的像素点扩散得更慢,从而更好地保留了图像的细节信息。这一理论的提出,标志着计算机视觉领域中对图像细节保护的重视,为后续Stable Diffusion技术的发展打下了坚实的基础。
虽然早期的研究主要集中在理论层面,但很快这些理论就被实际应用于图像处理中,尤其是在图像去噪、边缘增强等方面表现出色。这种从理论到实践的转变,不仅验证了非线性扩散模型的有效性,也推动了相关技术的进一步发展。
1992年,Chaudhuri和Tandon提出了自适应扩散方程,这是对原有非线性扩散模型的重要改进。通过根据图像特征自动调整扩散速度,这一方法极大地提高了模型处理不同类型图像时的灵活性和效率。
1995年,Weickert在研究中引入了结构张量的概念,用以更精确地计算图像中各像素的梯度。这一创新不仅优化了扩散结果,还为后续的双结构张量方法奠定了基础,进一步改善了图像处理的质量
2007年,Alvarez等人将时空稳定扩散技术引入到动态图像处理中,这标志着Stable Diffusion技术向视频处理等更广泛应用领域的扩展
Stable Diffusion 作为一款强大的 AI 绘画工具,可以用在哪些场景呢?
这里也只是列出了 Stable Diffusion 的一部分应用场景,随着相关技术的进步,Stable Diffusion 的应用场景还会越来越广泛,成为大家提高创造力和生产力的好帮手。当然,艺术创意和审美判断仍然需要人类的专业知识和审美眼光,只有人与机器更好地结合、互补,设计领域才可以发展得更好。
Stable Diffusion由三个主要部分组成:文本编码器、UNet噪声预测网络和VAE(Variational Autoencoder)。整个处理流程开始于接收一个文本输入,然后使用CLIP模型对文本进行编码,获得文本嵌入。接着,系统从潜在空间生成噪声向量,这个噪声向量随后被用于生成最终的图像
用户首先提供一段描述性文本,这段文本会被送入到一个预训练的CLIP模型中。CLIP模型包括两个部分,一个用于处理文本的TextEncoder和一个用于处理图像的ImageEncoder。这两部分共同工作,将文本信息转换为可以与图像数据对应起来的向量形式。这种转换确保了生成的图像能够尽可能地反映出用户输入的文本描述的内容。
在得到文本嵌入后,系统会生成一个初始的潜在空间向量,这一向量本质上是随机噪声。然后,这个噪声向量和文本嵌入一起被送入UNet模型。UNet模型在这里扮演的是降噪的角色,即通过多次迭代去预测并消除噪声向量中的噪声成分。每一步降噪都会使图像逐渐变得清晰,直至最终形成符合文本描述的图像。
在UNet模型处理之后,得到的降噪结果被送入VAE的解码器部分。VAE在这里的作用是将潜在空间的向量转换回像素空间,从而生成最终的用户可见的图像。VAE的使用不仅帮助模型在较低维度上高效地操作,还负责最终图像的生成质量。这一步是整个Stable Diffusion过程中的关键,因为它直接决定了输出图像的质量和细节丰富度。
操作系统:Windows10及以上
CPU:不做强制性要求
内存:至少8GB,推荐16GB及以上
显卡:必须是英伟达NVIDIA的独立显卡,至少4GB显存,推荐20系以后,8GB显存及以上(AMD显卡、核显只能用CPU跑)
硬盘:固态硬盘(由于模型文件普遍较大,推荐预留500GB-1TB硬盘空间)
这里介绍下Windows环境下手动安装的过程:
git clone https://github.com/AUTOMATIC1111/stable-diffusion-webui.git
下载WebUI代码。stable-diffusion-webui
文件夹,下载这个档案文件,并将文件放到stable-diffusion-webui\models\Stable-diffusion
文件夹下。stable-diffusion-wbui
文件夹,运行webui-user.bat
批处理文件。http://127.0.0.1:7860
即可开始使用Stable Diffusion。Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。