赞
踩
经过4个月的沉寂,Stable Diffusion的原团队再次出发,他们推出了性能卓越的开源文本到图像模型FLUX.1,其表现在多个方面超越了Midjourney和DALL-E。
今年 3 月底,Stability AI 遭遇了资金和运营上的压力,内部动荡,联合创始人遭到解职,而关键团队成员 Robin 也决定退出。
经过 4 个月的时间,Robin 宣布了新的创业计划,成立了 Black Forest Labs。8 月 1 日,Black Forest Labs 发布了他们的 FLUX.1 图像生成模型。
官方博客宣称,该模型在图像细节呈现、提示词的遵循度、风格多样性以及场景复杂性方面均达到了行业领先水平。其官方网站上公布的 ELO 评分显示,FLUX.1 已经超过了 Midjourney-V6.0 和 Stable Diffusion3-Ultra 的评分。
版本名称 | 说明 | 获取方式 |
---|---|---|
FLUX.1 [pro][专业版] | 提供最先进的性能图像生成,具有顶级的即时跟踪、视觉质量、图像细节和输出多样性。 | 通过 Black Forest Labs 的 API 注册 FLUX.1 [pro]申请 |
FLUX.1 [dev] [开发版] | 一种开放权重、指导提炼的模型,适用于非商业应用 | 可在开源网站下载 |
FLUX.1 [schnell] [快速] | 可以商用的开源模型,为本地开发和个人使用量身定制的 | 完全开源,可在 Comfyui 中使用 |
此外,FLUX团队已经开始着手训练DiT视频生成模型。他们的官方网站上展示了相关演示视频,这些视频在运动幅度、稳定性以及物理效果方面表现出色。
看评测说得很厉害的样子,那么FLUX 到底厉害在哪,我们来看看优势说明。
提升的图像品质:FLUX 能够以更高的分辨率生成令人印象深刻的视觉效果,并支持各种自定义分辨率比例的直接绘图输出。在美学评分ELO上,FLUX的得分在很多方面都超过了SD3和MJ6。
先进的人体解剖学和逼真度:FLUX 在直接生成完美手指和脚趾的绘图方面取得了近乎完美的成果,显著降低了多指或畸形出现的概率。直白点说,就是画的手、脚比较不会变形,比如多手指,少手指等。
精确的英文文字渲染和复杂提示处理:FLUX 能够精确渲染英文文字,并且能够准确遵循复杂的提示语,展现出卓越的处理能力。
对于小白理解,简化来说就是生成的图片效果更好,分辨率更好,生成的人物手脚不会那么容易蹦。
那么说了那么多,效果怎么样呢?
行者使用的是仙宫云平台的FLUX工作流来进行评测。(本地没有24G显存,肝不起)
接下来我从个人像、写实、科幻、文字嵌入、风景、动物、二次元等多个风格来进行出图测试。
提示词:Bridge attire, white dress, floral background, elegant, white whole body, Asian women, upscale, big flower pets, soft lighting, romantic, dreamy, luxurious, detailed texture, wide skirt, monochrome palette, light makeup, dreamy blue, high-quality images, ethereal, clear focus, studio photos, complex details, highly detailed, ultra-realistic, high-definition, professional photography, Nikon camera, high-quality, movie, 16K, ultra high resolution, super detail,
提示词:filmic photo of a group of three women on a street downtown, they are holding their hands up the camera
提示词:A hidden cenote in the heart of a lush jungle beckons with crystalline turquoise waters. Vibrant emerald vines cascade down weathered limestone walls, their tendrils barely kissing the water’s surface. Shafts of golden sunlight pierce through a natural skylight above, creating a mystical interplay of light and shadow on the cavern walls. Iridescent butterflies flit between exotic orchids clinging to rocky outcrops. A partially submerged Mayan ruin, its intricate carvings softened by time, stands as a silent sentinel at the water’s edge. Schools of tiny silver fish dart through the crystal-clear depths, their scales glinting like underwater stars. At the far end of the cenote, a small waterfall tumbles melodiously into the pool, its mist creating ephemeral rainbows in the dappled light.
提示词:neonpunk style light art,ferrari sports car,cyberpunk streets,parkour posture,crossover,the vortex formed by the light,glow,dynamic fuzzy,swirl,time tunnel,(low viewing angle:1.2),random,from_below,crowd,impact action style,blurry,character focus,. cyberpunk,vaporwave,neon,vibes,vibrant,stunningly beautiful,crisp,detailed,sleek,ultramodern,magenta highlights,dark purple shadows,high contrast,cinematic,ultra detailed,intricate,professional,
提示词:Close-up portrait of an iPhone 15 Pro Max on grassland, the text " I love poju" is on the screen of the phone, with neon lighting, on-trend Apple INC advertisement style, award-winning picture, highly detailed, ultra-high resolutions, 32K UHD, sharp focus, best quality, masterpiece
提示词:a young woman with office look hold a rose flowers and a card with text:“LOVE” in street. advertisement photography,high contrast color theme, Minimalism theme.realistic photography.cinema film
提示词:Michelin Guide, a plate of Chinese egg fried rice on the table, garnish, highly detailed, ultra-high resolutions, 32K UHD, best quality, masterpiece,
提示词:(A panda in Bruce Lee Kung Fu pose, movie splash screen (text “Kung Fu Panda”: 1.9)) (Natural Order Style Spell: 1.5) (Hollywood Movie Poster: 1.2) Magical Fantasy (centered on a panda wearing a black Tang costume and casting a green spell: 1.9). (Yin Yang Tai Chi Magic Circle 1.5)(Multiple magic rings intertwined with complex and mysterious light tracks: 1.5), meteor showers in the night sky, fluorescent water in the deep sea, dazzling, as if you are in a fantasy world full of magical miracles.(baixl-shuimo)(kungfu)(mysterious luminous text symbol, Natural Order Style)
提示词:yuan_cosmetics_mockup,cosmetic tube mockup,no humans,red background,minimalistic space aesthetic,bubble,flower,gradient background,still life,gradient,photorealistic,
提示词:masterpiece, best quality, ultra-detailed, illustration, portrait, (miku), solo, face to viewer, looking at viewer, hair between eyes, cyan long hair, cyan medium eyes, round face, blush, a little sad, scarf, white dress, blue bowknot on chest, medium breasts, sakura blossoms, wind flow, floating petals.
提示词:beautiful anime artwork, a cute anime catgirl that looks depressed holding a piece of paper with a smile drawn on it over her mouth, she is about to cry
提示词:3D IP orange canvas shoes, blue background, full body solo, colorful, full body image, 3D cartoon, a fashion princess, face the audience
提示词:Surrealism Dream Style,glowing neon color,highly detailed,ultra-high resolutions,32K UHD,IMAX,best quality,masterpiece,at night,clouds,vintage bus, driving on the highway, painting the gate with light, crossing time and space, clouds, smoke, mystery,
目前有多种体验方式,官方在线体验、云平台使用,如仙宫云平台、哩布、吐司,以及本地部署ComfyUI。
官方的3个版本,提供了在线体验的环境。
以flux-dev 开发版为例,打开页面,输入提示词,选择分辨率,点击运行即可,在1分钟内就生成图片。
ComfyUI 的最新版本现已兼容Flux模型,您只需将ComfyUI升级至最新版即可享受这一新功能。
(需要的同学可以自行扫描获取)
整体使用来说,FLUX 有几个比较明显的优点:
1、出图的手部比较稳定,没有那么容易出现坏手、坏脚
2、出图速度快,基本上30S能完成出图(我用的是云端4090显卡)
3、模型的兼容性强:不管是二次元、人像模型、写实、电商、风景等不同风格的出图效果都可以
如果说非要做个对比,我感觉Flux这个版本会比SD3强(目前SD3放出来的版本也不是质量最好的),但是说比上MJ,那还是有差距的。最近Mindjpurney V6.1的优化版本,出的图真的香。
对于我们AI绘画玩家来说,AI工具进化这么快,原则上说,选择哪个工具,还是要从我们的使用场景来考虑。
感兴趣的小伙伴,赠送全套AIGC学习资料,包含AI绘画、AI人工智能等前沿科技教程和软件工具,具体看这里。
AIGC技术的未来发展前景广阔,随着人工智能技术的不断发展,AIGC技术也将不断提高。未来,AIGC技术将在游戏和计算领域得到更广泛的应用,使游戏和计算系统具有更高效、更智能、更灵活的特性。同时,AIGC技术也将与人工智能技术紧密结合,在更多的领域得到广泛应用,对程序员来说影响至关重要。未来,AIGC技术将继续得到提高,同时也将与人工智能技术紧密结合,在更多的领域得到广泛应用。
AIGC所有方向的技术点做的整理,形成各个领域的知识点汇总,它的用处就在于,你可以按照下面的知识点去找对应的学习资源,保证自己学得较为全面。
工具都帮大家整理好了,安装就可直接上手!
当我学到一定基础,有自己的理解能力的时候,会去阅读一些前辈整理的书籍或者手写的笔记资料,这些笔记详细记载了他们对一些技术点的理解,这些理解是比较独到,可以学到不一样的思路。
观看全面零基础学习视频,看视频学习是最快捷也是最有效果的方式,跟着视频中老师的思路,从基础到深入,还是很容易入门的。
纸上得来终觉浅,要学会跟着视频一起敲,要动手实操,才能将自己的所学运用到实际当中去,这时候可以搞点实战案例来学习。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。