赞
踩
Stability AI最近发布了Stable Diffusion 3 Medium(简称SD3 Medium),这是其最新的文生图模型,被官方称为“迄今为止最先进的开源模型”。SD3 Medium的性能甚至超过了Midjourney 6,特别是在生成手部和脸部图像方面表现出色,能够生成高度逼真的图像。这一模型还利用了其底层的Diffusion Transformer架构,以高精度整合文字元素。此外,SD3 Medium易于使用,并能在消费级显卡上运行,从而加速了其普及和适配。
Stability AI计划在未来将其产品扩展到视频和音频生成领域。目前,SD3 Medium已经在Hugging Face上开源,拥有20亿参数,相较于前两代模型,在照片真实感、样式、图片质量、算力资源消耗等方面都进行了大幅度优化。Stable Diffusion 3系列已被全球数百万开发者使用,很多文生视频/3D模型也借鉴了该架构。
这一开源举措在AI社区引起了广泛关注。Stable Diffusion 3的开源被认为是AI图像生成领域的一个重要里程碑,其强大的架构、更好的明暗对比度、提示遵循、训练结果、模型合并、图像分辨率等方面都带来了显著贡献。此外,这一模型在训练时会捕获更多细节,不仅提高了模型的质量,而且实际上带来了更快的训练速度。这些改进使得SD3成为目前图像生成领域的领先开源模型。
Stable Diffusion 3 Medium(SD3 Medium)相比于前几个版本的模型,具有以下几个显著的优点:
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。