当前位置:   article > 正文

AI免费设计LOGO效果惊艳,雷军200万花早了

人工智能生成logo免费
萧箫 发自 凹非寺
量子位 | 公众号 QbitAI

很快啊,Stable Diffusion又被发掘新用途了——

设计LOGO最关键的“形意结合”,被它拿捏得明明白白。看见Cat秒画猫猫头:

25e9afb85f301e28752d143cde8d50d4.gif

瑜伽店YOGA几个字母用人体形态一转换,风格完全不出错:

3f977a2d2174026cd31821dd33d833f1.gif

只设计其中一个字也没问题,例如将Dog的D画成一个狗子:

dbf6007548f9bc71251e07871a8f0ab7.gif

属实简洁又传神了有木有!

哪怕是面对中文字体,AI也能很好地理解其中的意思,快速画出甲方想要传达的LOGO形象:

dd655fea8d2cd2f9bfb5902e355b572f.png

要是开店用上这个,哪里还需要花几十上百块专门设计一个LOGO出来?(doge)

虽然之前也有不少设计LOGO的AI了,不过从这次生成的效果来看,还真有点不太一样。

保留一部分原有字体的味道

事实上,在这次研究之前,已经有不少研究在考虑如何用AI设计LOGO。

从效果来看,主要可以分成三类:

一是以字体为形状限制,将图片风格迁移上去(如图AB);二是以图片风格为基底,将字体迁移到图片中去(图D);三是将不同图片的形状和字体关联起来,生成或彩色或黑白的“图像拼接”风格LOGO设计(图CE)。

ca4bb44e60a45fb39b7f924d04c09779.png

然而,与下面人类手工设计的LOGO比起来,上面AI设计的效果不能说不好看,但似乎还差那么点意思:

7efbeb2b49b98a633c7b730897b6a014.png

作者们经过一通探查,发现人类手工设计的LOGO并不“喧宾夺主”。

人类设计师会在保留原本字体特色、让人们能一眼认出单词的基础上,再加入一点创新之处,例如将Jazz中的J改成乐器,但其他人一眼仍然能认出“JAZZ”字体的形状。

整体来说,就是在保留一部分字体“味道”的同时,加入一定的设计感。

67ae41fcabd15c6bf5aeb6970d73e871.png

例如这是Stable Diffusion生成的“FROG”设计,FRO仍然是原本字体的形状,只有G变成一只跳出去的小青蛙:

7aa38c5d50c7aad3758f39e558428ac2.png

如果用Stable Diffusion 2进一步进行后期处理的话,还能进一步实现上色功能,显得更加生动:

35ebcc3df6d2c7c652fc720ff3a7552b.png

生成LOGO的风格也能随着原本设计字体的变化,而产生不一样的变化。

例如这是8种字体下生成的不同瑜伽LOGO,每种风格都不一样:

f8f341a31db92101bb4f0f3bc18794e6.png

相比之下,其他AI模型在生成字体的时候,倒是更喜欢保留自己的风格(手动狗头):

8f064feaac06f360f00568d31b65ee41.png

那么,这种神奇的字体设计AI是怎么做出来的?

用贝塞尔曲线调整字母形状

为了一定程度上保留原本字体的风格、以及只改变单词中的某几个字母,作者们想出一种“微调”字母形状的方法——

那就是让AI学会用贝塞尔曲线,对不同字体的字母进行小幅度变形。

(用过PS中“钢笔”的小伙伴们应该对贝塞尔曲线不陌生,用它能控制鼠标画出一些神奇的曲线)

371d879426d4064eb6d141720b8ac19d.gif

具体控制点数量,则根据字母复杂度和字体风格进行迭代变换,直到设计出来的字母符合要求,其中橙色是初始点,蓝色是后续增加的控制点:

6597db7c283717d18aa898fef9b58c5f.png

控制点数量对生成效果影响有多大?

例如这是不同数量的控制点生成字母的效果,如果数量太少,会看不清设计的图像形状;但数量过多又容易扭曲字体原本的形状:

30a8cb8d10f5caa7ed23f5f4fffc17a0.png

基于这种核心设计思路,作者们结合Stable Diffusion和CLIP,设计出了一整个字体设计AI模型:

31035fc16d4eded5e8d6c401a20ff602.png

其中,ACAP(as conformal as possible)损失函数基于德劳内三角形剖分算法,对字母形状进一步进行了约束。

例如这是PANTS(裤子)在变形前和变形之后的形态,可以看见ACAP在保留裤子形态的同时,也保留了字体的效果:

b1a785a6e2fb94db38c84de6fb1e9a0a.png

与此同时,为了进一步保留字体形态,作者们采用了一个低通滤波器,保证调整后的字母不与原始字母偏离太多。例如这是Bear(熊)中的B调整后的形态:

5557e92a697130bb5cc07183fa374f0c.png

应用这套模型,生成每个字母的速度也还不错。

在一块RTX 2080 GPU上,生成单个字母的LOGO设计大约需要5分钟

作者介绍

虽然作者们放到项目主页上的论文是匿名的:

938acba75597a6d943c09e8ff1eb1e21.png

不过在arXiv上,作者们的名字倒是已经公开了,他们分别来自以色列特拉维夫大学、Reichman University(莱希曼大学),以及伦敦大学金史密斯学院:

4a438ca9a1f2c07be99e29a0690ca2b0.png

共同一作Shir Iluz,特拉维夫大学电子与电气工程理学硕士,目前的研究方向是生成AI,感兴趣的方向是深度学习与计算机视觉。

75acadda3fe6cb606e09a4c082d808da.png

共同一作Yael Vinker,特拉维夫大学计算机视觉博士生,曾经在以色列希伯来大学获得计算机科学本科与硕士学位,目前研究方向同样是深度学习与计算机视觉。

a74417ac0747e9e381100d63b5a76442.png

这么看来,雷军当年设计小米LOGO的200万元花早了啊afb4089c3037b4c460bd0162aef61ac8.png

论文地址:
https://arxiv.org/abs/2303.01818

项目地址:
https://wordasimage.github.io/Word-As-Image-Page/

「中国AIGC产业峰会」启动

邀您共襄盛举

「中国AIGC产业峰会」即将在今年3月举办,峰会将邀请AIGC产业相关领域的专家学者,共同探讨生成新世界的过去、现在和未来。

峰会上还将发布《中国AIGC产业全景报告暨AIGC 50》,全面立体描绘我国当前AIGC产业的竞争力图谱。点击链接或下方图片查看大会详情:

被ChatGPT带飞的AIGC如何在中国落地?量子位邀你共同参与中国AIGC产业峰会

ce91bc3d409b952085f91bcff783dfed.gif

点这里声明:本文内容由网友自发贡献,转载请注明出处:【wpsshop博客】

推荐阅读
相关标签