赞
踩
大家好,我是木易,一个持续关注AI领域的互联网技术产品经理,国内Top2本科,美国Top10 CS研究生,MBA。我坚信AI是普通人变强的“外挂”,所以创建了“AI信息Gap”这个公众号,专注于分享AI全维度知识,包括但不限于AI科普,AI工具测评,AI效率提升,AI行业洞察。关注我,AI之路不迷路,2024谷歌一起变强。
Stability AI是一家致力于通过AIGC(生成式人工智能)激发人类潜能的公司。该公司由拥有牛津大学数学和计算机科学硕士学位的Emad Mostaque成立,旨在为每个人、每个地方提供开放模式的AI工具,覆盖视觉艺术、音乐等多个领域。
Stability AI在一轮由Coatue和Lightspeed Venture Partners领投的融资中筹集了1.01亿美元,标志着对 AI 驱动内容生成需求的增长,并将公司估值达到10亿美元。Stability AI 运营着一个包含超过4000个 Nvidia A100 GPU 的集群,其旗舰项目Stable Diffusion在开源AI社区中具有重要影响,尽管其内容审核的争议也伴随而来。
Stability AI最近推出了其首个开放视频模型“Stable Video”,这是一个旨在服务于媒体、娱乐、教育和营销等广泛视频应用领域的创新工具。Stable Video使个人能够将文本和图像输入转化为生动的场景,提升概念至活动影像,创造电影级作品。Stable Video Diffusion发布了两种图像到视频的模型,能够生成14帧和25帧的视频,帧率可在3到30帧每秒之间自定义。在初始形态发布时,这些模型在用户偏好研究中超越了其他领先的封闭模型。视频的持续时间可达2至5秒,处理时间不超过2分钟。
此外,Stability AI通过这个研究版本释出了Stable Video Diffusion的代码,并在其GitHub存储库和Hugging Face页面上提供了运行模型所需的权重。该模型可适应多种视频应用任务,包括从单一图像进行多视角合成,以及在多视角数据集上进行微调。
该平台通过简化视频制作过程,即使是没有专业视频编辑技能的用户也能快速创建吸引人的视频。Stable Video目前处于公测阶段,每个人都可以免费使用。
Stable Video提供免费额度,每天赠送150个积分,可以生成15个免费视频。对于需要更多视频生成的用户,官方还提供了积分购买选项,包括10美元的500积分包和50美元的3000积分包,积分永久有效。对于一般用户来说,每天重置的150积分已经足够我们愉快地体验和玩耍了吧。
由于平台限制,无法上传大于5M的图片/动画,请前往我的公众号查看完整文章内容。
按照下面的地址进入官网,注册账号并登录。最便捷的方法是直接选择谷歌账号登录。值得一提的是,今天(2月26日)我亲测,国内可以直接打开Stable Video网站。但如果想使用谷歌一键登录,还是需要魔法的。也可以选择输入自己的邮箱账号注册登录。
Stable Video体验地址:https://www.stablevideo.com/
点击顶部菜单栏里的Generate
即可开始体验。
或点击左下角的Start with Image
即可开始体验图片生成视频,Start with Text
即可开始体验文本生成视频。
以文本生成视频,在输入框里输入提示词。这里我们先用一条样本提示词进行测试。
提示词:A tranquil, realistic depiction of a sunset over calm ocean waters, with the sky ablaze in vibrant oranges and reds, reflecting softly on the water's surface.
点击Generate
。
首先Stable Video会先给我们生成视频里需要用到的图片。
目前我测试,服务器状态相当不稳定,有时候会报错,这个时候选择 Cancel
会返还积分给你。生成好的图片是这样的:
选择一张你比较满意的图片,然后按照下面的参数提示设置参数,点击Proceed
。其实不设置参数也够用,只是参数可以给你更多的选择,以增强视频生成效果和体验。
Locked
: 相机固定不动。
Shake
: 模拟相机震动效果。
相机的倾斜动作,可选向上 Up
或向下 Down
倾斜。
相机围绕场景旋转的动作。
相机的平移动作。
相机的缩放动作,可选放大 In
或缩小 Out
。
相机沿着某条线移动,模拟推进 In
或拉出 Out
的动作。
相机向上 Up
或向下 Down
的移动。
Seed: 种子数,默认设置即可。
Steps: 迭代步数,更多步数可生成更高质量视频,但生成速度较慢。
Motion Strength: 控制视频中运动量的参数,数值越高,视频中的运动效果越显著。
到这一步就可以等出片了,这时Stable Video会给你一些样本视频让你投票,这是收集用户反馈的一种方法,以便他们可以调整模型。类似于ChatGPT里的点赞和点踩功能。
由于平台限制,无法上传大于5M的图片/动画,请前往我的公众号查看完整文章内容。
效果相当不错!
为了对比,这里我们测试一个Sora曾经使用过的提示词。
提示词:A stylish woman walks down a Tokyo street filled with warm glowing neon and animated city signage. she wears a black leather jacket, a long red dress, and black boots, and carries a black purse. she wears sunglasses and red lipstick. she walks confidently and casually. the street is damp and reflective, creating a mirror effect of the colorful lights. many pedestrians walk about.
由于平台限制,无法上传大于5M的图片/动画,请前往我的公众号查看完整文章内容。
时长:目前Stable Video仅支持生成2-5s时长的视频,而Sora可以生成长达1分钟的视频,这是目前AI文生视频领域最长的视频生成程度。
视觉细节:Stable Video生成的图片/视频质量已经很不错了,但对一些细节的处理还不够,比如提示词里明确提到的“the street is damp and reflective, creating a mirror effect of the colorful lights”,Stable Video生成的视频完全没有体现地面潮湿、反光这一点。而Sora生成的视频则很好的体现了这一细节。
视频连贯性:文本生成视频,4s的视频保持连贯性和一致性相对容易实现。但要生成连贯的1分钟长度的视频,目前只有Sora能够做到。
关于Sora更多介绍,可以看我之前的这些文章:
都读到这里了,点个赞鼓励一下吧
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。