【AIGC半月报】AIGC大模型启元：2024.08（上）

作者：酷酷是懒虫 | 2024-08-04 02:10:09

踩

【AIGC半月报】AIGC大模型启元：2024.08（上））

- (1) FLUX.1（文生图多模态模型）

(1) FLUX.1（文生图多模态模型）

2024.08.02 昨天Midjourney刚进行大更新，今天文生图片开源领域就杀出了一匹大黑马—FLUX.1。
　　根据其测试数据显示，性能大幅度超过了DALL·E-3、Midjourney V6闭源模型，开源SD3系列的Ultra、Medium、Turbo和SDXL被全线秒杀。
　　并且FLUX.1表示，文生图只是一个开始，未来还会推出文生视频模型想和Sora、Gen-3、Luma等一线产品过过招。
　　FLUX.1的基础架构是基于Vision Transformer，使用了流程匹配训练方法，同时使用了旋转位置嵌入和并行注意层来提高模型的性能和硬件利用效率。
　　FLUX.1有120亿参数，本次一共发布了三个版本：1）Pro版，通过API使用；2）dev版，这是一个非商用的指导蒸馏模型，继承了Pro版多数性能；3）schnell版，可以商用的开源模型。
　　虽然FLUX.1有三个版本，但在文本语义还原、图片质量、动作一致性/连贯性、多样性等方面超过了Midjourney v6.0、DALL·E 3 、SD3-Ultra等主流开闭源模型，整体性能非常强劲。此外，在文本嵌入图片方面也比这些模型表现的更好。

本文内容由网友自发贡献，转载请注明出处：【wpsshop博客】