赞
踩
论文:https://arxiv.org/pdf/2405.01434
主页:StoryDiffusion: Consistent Self-Attention for Long-Range Image and Video Generation
本文提出了一种名为StoryDiffusion的新方法,用于生成一系列内容一致的图像和视频,特别是那些包含主体和复杂细节的图像。StoryDiffusion通过两种新颖的组件来实现这一目标:Consistent Self-Attention(一致性自注意力)和Semantic Motion Predictor(语义运动预测器)。
本文提出的StoryDiffusion框架主要分为两个阶段来生成一致性图像和视频:
整个StoryDiffusion框架的设计旨在通过这两个阶段,实现文本故事到一致性图像和视频的高效生成,同时保持对文本提示的高控制性。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。