赞
踩
SVD官方
主页 : Huggingface | | Stability.ai || 论文
地址
huggingface在线运行demo : https://huggingface.co/spaces/multimodalart/stable-video-diffusion
SVD开源代码
:Github(含其他项目) || Huggingface
在Comfyui使用
: ComfyUI国内下载 | SVD模型下载 | | 官网下载(Github)
2023年11月21日 由 Stability AI
开源2个图片到视频模型
(“Stable Video Diffusion”(稳定视频扩散模型)
它将静止图像(still image)作为条件帧(conditioning frame),并从中生成视频分辨率(1024x576
)。
短
(<=4秒),并且该模型没有实现完美的真实感。没变化
)。直接
文本控制模型 (需要串联其他模型)。文本
(legible text)(让艺术字动起来)。人脸和人物
可能无法正确生成。显存
)使用说明: https://comfyanonymous.github.io/ComfyUI_examples/video/
工作流文件: 链接:https://pan.baidu.com/s/1CvyGmUibreM8SM7AFjt1uA?pwd=0125
photograph beautiful scenery nature mountains alps river rapids snow sky cumulus clouds
题词来源于论文图17
题词
A boat sailing leisurely along the Seine River with the Eiffel Tower in background by Vincent van Gogh
A unicorn in a magical grove, extremely detailed
该模型训练经过,
576x1024
的分辨率生成25帧,微调
为视频[14帧]。我们还对广泛使用的f8解码器
( f8-decoder )进行了时间一致性(temporal consistency)微调。逐帧解码器
(frame-wise decoder )。利用了Nvidia提出的Align your Latents基本结构
Align your Latents: 23.07.High-Resolution Video Synthesis with Latent Diffusion Models
项目主页: https://research.nvidia.com/labs/toronto-ai/VideoLDM/
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。