当前位置:   article > 正文

diffusion新高度!可一次性生成200张图??

stable diffusion 批量生成

f620cf7f278905b4c2b66e7682aac5a9.png

文 | Pine 明敏(凹非寺)
源 | 量子位

给AI一个提示词,一次性出200张图

a4df5e0e6a4cc59b740832a312eab693.gif

生成速度嗖嗖的,不到3分钟全搞定。

a9e478adab6bd7c6f126641daa04ee34.png

喜欢哪张任君挑选,还能直接二次调整编辑。

dcc2ecdbcaac14655aba2b89bb3e68c7.gif

咱就是说,这回用AI画画,终于不废人了!要知道,基础版Stable Diffusion默认一次只生成4张图片

所以当我终于用AI生成了一张满意的图片时,状态往往是酱婶儿的……!

这就是新鲜出炉的Stableboost,一个新设计的Stable Diffusion交互界面。它要做的事很简单,就是把Stable Diffusion的生产效率提高再提高。

而且,Stableboost可白嫖!每个月会有500分的免费额度使用。超出额度之后每张图只收取1美分,仅为覆盖运营成本。

网站一经发布就引发各路网友围观。

cc4e6b038a789141313a0dfa6ae3e7db.png

这一回Stable Diffusion真有生产力工具那味儿了。

网站制作者的来头也不小。主要开发者是前特斯拉自动驾驶ML工程师。

还有特斯拉前高级AI主管安德烈·卡帕斯(Andrej Karpathy)给网站提供建议,他此前负责过的项目有特斯拉自动驾驶AutoPilot、特斯拉超算Dojo、特斯拉擎天柱人形机器人……

所以这个网站到底能干啥?一起来看~

可白嫖的超强操作界面

这个新出的AI画师最突出的一个特点就是可操作性强

看它的设置界面,用户可以自定义设置的有这这这么长一串,图片数量、生成质量、尺寸……

a74373655384959cf45db1083f8b0143.gif

图片的数量可以从1~200之间任意选择,当然选择的数量越多,等得时间也就稍微久一丢。

要想设置生成图片的质量,可以滑动“Steps”和“Guidance scale”和调节。

0dd7b2d4747bdce2552edfbba280cd07.png

图片的尺寸自然也不用多说,直接设置高和宽就欧克。

bf89b0bc16d8ead72e30b60af8051dd2.png

绘画的工具已经调试完后,就能安心地进行“创作”了。和其他的AI一样,输入提示词后,就能安心等待它的生成结果了。

不过得多提一嘴的是,Stableboost新增了个“修饰词”功能,就是说可以在原有的提示词上添加多个不同的修饰词,并且提示词可以和这些修饰词自由组合

比如说咱现在输入一个提示词:小狗,修饰词可以设置为:森林、河边、夜晚。生成的结果是这样的:

8214294fad81d472a2cc85f0598105a0.gif

而且,为了更方便挑选图片,Stableboost还贴心地提供了筛选功能。

6e17ecddb95ecb4f77478c24719f9aae.png

可以根据标签、图片质量、修饰词来筛选图片。

d75465034e305cfb21c3dde5a3f50955.gif

此外,它还能精益求精进行二次筛选,直接在上一步选出的图片上进行操作,点击图片右下的“放大镜”,可以进一步生成更多类似的图片。

913b0ccc94f86ba221fad77ab907b3d6.gif

不过这个筛选方法都还只是开碟小菜,Stableboost这次还整明白了“算法推荐”这一套。

用户只需要在生成的图片中点击自己最钟意的那个,再点击右下角的“循环”按钮,这样Stableboost就会生成更多这种风格的图片。

并且,之后用户每点击一次图片,生成的结果都会不断变化。

b5801345aa17ea0dd7e83b341ba30d7c.gif

值得一提的是,Stableboost还可以在原有图片上进行二次编辑,比如说想给这位酷girl带个眼镜:

9ba7bf39a5a921501c856b586d54cad2.gif

除了能生成图片外,Stableboost还可以生成视频,不过目前还比较初级,只是在不同提示词之间插入过渡帧。

0bb4e6df21285efb7aa947b0d686438c.gif

特斯拉前AI主管参与开发

体验了一圈下来,感觉Stableboost还是非常丝滑的~有网友已经开始和作者许愿了:会不会加入Dreambooth呢?

baed9124e09eac9104fb22977467eb95.png

偶买噶不敢想,DreamBooth可是只需3-5张图片,加上文字表述,就能让指定物体迁移到其他场景或风格中去。

0802a7a92fe9c9772377d582b1fc9d5c.png

如果能all in one,AI作画的效率恐怕又上了一个台阶。

再看一眼网站的幕后团队,嗯,感觉这事儿不是不可能。

主要开发者塔尔·施塔默(Tal Stramer),是资深AI工程师。先后在推特、特斯拉、谷歌工作过。

今年6月他才结束了在特斯拉长达4年半的工作,离职前的职位是自动驾驶ML工程师

ea7468575a04077e125a90955ab99990.png

另一位提供重要建议的,是前特斯拉高级AI主管安德烈·卡帕斯(Andrej Karpathy)。

他负责了几乎特斯拉所有明星项目:自动驾驶AutoPilot、超算Dojo、擎天柱人形机器人……是OpenAI的发起人之一,也是李飞飞教授的高徒。

今年7月,安德烈对外官宣从特斯拉离职,连马斯克都罕见发推回应:感谢你为特斯拉所做的一切,与你共事是我的荣幸。

99af544875123f844e6ae31fcd1836ee.png

离职后,安德烈表示接下来还没有明确的工作去向,希望花更多时间在AI、开源和技术教育等方面的事情上。

的确,在他还读博时,就亲自设计并主讲了一门名为「CS231n:用于视觉识别的卷积神经网络」的课程,成为斯坦福授课深度学习的讲师。

前几天他还做客了一档播客节目,和MIT人工智能专家Lex Fridman探讨了自动驾驶、人形机器人、AGI、特斯拉视觉方案等内容。

369ca98a18a7e6ccdef92f7afb06cec7.png

而从大佬这几个月的发推动向来看,他对AI画画很感兴趣。

这不,Stableboost就来了。感兴趣的童鞋快去自己体验吧~

传送门:
https://stableboost.ai/images

dda76eba554c450aecfe60320e491a19.jpeg后台回复关键词【入群

加入卖萌屋NLP、CV、搜广推与求职讨论群

46367882e6b6dc95649b98c9fbbf500a.png
[1]https://twitter.com/tall/status/1587913529587249152
[2]https://twitter.com/karpathy/status/1587920309587304451
声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/知新_RL/article/detail/807050
推荐阅读
相关标签
  

闽ICP备14008679号