当前位置:   article > 正文

SAM&Stable-Diffusion集成进化!分割、生成一切!AI绘画新玩法

sam可以结合文本分割demo

eca195e34dd6320bfa8edf9422461579.gif

SAM「分割一切」模型推出之后,二创潮就开始了,有想法有行动!

飞桨AI Studio开发者会唱歌的炼丹师就创作出SAM进化版,将SAM、Stable Diffusion集成,实现「分割」、「生成」能力二合一,并部署为应用,支持在线使用!

d7f7b519129cd16698c65bbbda65372a.png

bf4a2045be74946a53c5abc2c6d80bf4.png在线免费使用应用

outside_default.png


创作者:会唱歌的炼丹师
作者主页:https://aistudio.baidu.com/aistudio/personalcenter/thirdview/338262‍‍

应用使用参数解读:

Text:sam分割图像的分割对象,如输入car,就会把图片中的car进行分割。

Prompt:针对分割对象的可控文本生成,输入对应的Prompt

Advanced options:高级选项

Images:生成图像数量

Image Resolution:生成图像分辨率,一般使用为512*512

Control Strength:control model 生成的条件合并到 stable diffsion 模型上的权重,默认为 1

Guess Model:为使用更多样性的结果,生成后得到不那么遵守图像条件的结果

Segmentation Resolution:图像分割分辨率

Steps:推理步长

Guidance Scale:是一种增加对指导生成(在本例中为文本)以及总体样本质量的条件信号的依从性的方法。它也被称为无分类器引导,简单地说,调整它可以更好的使用图像质量更好或更具备多样性。值介于7和8.5之间通常是稳定扩散的好选择。默认情况下使用为7.5。

如果值很大, 图像质量可能更好,但对应的多样性会降低

如果值很小, 图像质量可能更差,但对应的多样性会增加

Seed:随机种子数

eta (DDIM):DDIM采样方法

Added Prompt:在上述Prompt基础上所额外添加的提示,使生成的图片更好

Negative Prompt:控制sd生成的图片把那些相关提示过滤

f81bce6dcdc4df35858bae2b402b613c.png

使用技术

Segment Anything:提示词分割的大模型

ControlNet Canny :对分割图进行边缘检测,以此作为图像生成的控制条件

Stable Diffusion :文本到图像的扩散大模型

通过Segment Anything Model强大的图像分割能力,我们可以很好的得到分割后的像素图。然后由ControlNet with Stable Diffusion将控制图为不同语义的分割图和文本(prompt)作为控制条件来完成Segment to Image任务。这样Segment Anything Model通过ControlNet与Stable Diffusion进行集成。

b6997ed48f3422432d924328b332b276.png

2fc081a373de396ba7a09379f9c8f6db.png

ed79f55f74759ec8a5c8b9b0e75e5769.png

fork项目运行

19da97bc58b0d6ffb13694a1ad0181ac.png

fork该项目

f80a7eb14faa50f7bd8370eac7cb065a.png68bd95165a38ec9072c0db259811720a.png启动进入线上开发环境

建议选择V100 32GB开发环境。‍

972ecb2b365cd41e6f9456d72c3672aa.png

飞桨AI Studio每周运行项目即可免费获得56小时V100 32G算力20d12d9dc1987d5c3e5bb3ef31ab7eab.png

安装ppdiffusers依赖

  1. 1# 安装paddlenlp和ppdiffusers依赖
  2. 2!pip install "paddlenlp>=2.5.2" "ppdiffusers>=0.11.1" safetensors --user
  1. 1# 采用Canny边缘检测图片作为控制条件
  2. 2!python gradio_canny2image.py
  1. 1# 采用ADE20K分割协议的图片作为控制条件
  2. 2!python gradio_seg2image_segmenter.py

安装ppsegSAM依赖

  1. 1# 安装依赖
  2. 2!pip install -r requirements.txt --user
  1. 1# 下载样例图片
  2. 2!mkdir ~/examples
  3. 3%cd ~/examples
  4. 4!wget https://paddleseg.bj.bcebos.com/dygraph/demo/cityscapes_demo.png
  1. 1# 下载分词表
  2. 2%cd ~
  3. 3!wget https://bj.bcebos.com/paddleseg/dygraph/bpe_vocab_16e6/bpe_simple_vocab_16e6.txt.gz
  1. 1# 运行脚本
  2. 2!python scripts/text_to_sam_clip.py --model-type vit_h

AI技术日日迭代,期待各位开发者精彩创作,也诚邀各位开发者加入AI Studio进行开源创作,详细创作激励体系请点击底部阅读原文

f74a1abc7e1313a4301c0197ff0ad7b7.gif

关注【飞桨PaddlePaddle】公众号

获取更多技术内容~

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/IT小白/article/detail/316454
推荐阅读
相关标签
  

闽ICP备14008679号