当前位置:   article > 正文

郭文景Pika再融5.8个亿,最新估值约34亿,已自研AI视频生成基础模型

郭文景Pika再融5.8个亿,最新估值约34亿,已自研AI视频生成基础模型
一水 发自 凹非寺
量子位 | 公众号 QbitAI

AI视频顶流Pika拿着8000万美元(约5.8亿人民币)新融资又杀回来了!

投资者包括Spark Capital(领投)、Lightspeed和Greycrof等著名机构。

Pika回应量子位,本轮投后最新估值将来到4.7亿美元(约34亿人民币)。

这家由两位斯坦福华人博士创立的公司曾在去年底推出了产品1.0并宣布融资5500万美元。

790d08d9279f01cf142172aa0d381013.png

而后半年,Pika从最初的4人团队扩展至13人,并陆续上线了几项新功能,还在今年4月入选福布斯AI50强榜单。

Pika所在的AI视频生成赛道,今年在技术投融资领域均迎来双重爆发。

技术方面OpenAI发布的Sora为行业树立了新的标杆,将时长一举拉到60s,而后开源社区发布了能生成2分钟视频的StreamingT2V,紧接着国内发布了对标Sora能生成16s、分辨率高达1080P的Vidu,再然后谷歌推出同样对标Sora能生成1分钟视频的Veo。

投资方面,继人们对文本和图像生成器的兴趣激增之后,使用AI生成视频被认为是下一个前沿领域,初创企业和大型科技公司都在押注该领域。除了Pika,其他AI视频初创公司Runway和Synthesia也在过去一年里筹集了大量资金。

目前,Pika等初创公司正在快速扩张,因为OpenAI和谷歌的视频工具尚未面向公众开放,这给它们留了一定时间。

那么,自半年前推出1.0以来,Pika后来都在忙啥呢?

AI视频生成赛道,在这段时间还有哪些大事件发生?

ced1c2b03190f20823abe065cea565fa.png

Pika最近半年干了啥?

概括而言,Pika近半年除了推出几项“锦上添花”的新功能外,一直在做产品和技术更新。

下面按照时间顺序大概梳理一下。

2023年12月,也就是Pika1.0上线后不久,其研究人员提出了将文本转3D生成速度提高4.7倍的方法。

这一被称为DreamPropeller的嵌入式加速算法,能够优化并增强任何基于分数蒸馏的文本到3D模型生成流程。

之后不久,Pika宣布面向所有公众开放,不过紧跟着推出了其付费订阅模式

75492990e15fa089632dcf5dca4afd52.png

到了今年2月底,Pika宣布推出可以给视频中的人物配音,并同时“对口型”的唇形同步功能Lip Sync

然后接着在3月份推出AI配音工具Sound Effects,有了这项新功能,用户既可以使用文本生成音效,也可以让Pika直接根据视频内容匹配音效

至今年4月,Pika在成立不到1年后入选了福布斯AI50强榜单。

a3d0128273722cd7471d0be1a94c6f8e.png

以上为Pika最近半年的动向,Pika表示公司目前拥有数百万用户(官方在彭博采访中未提供确切数字),不过能看到Discord上有近80万用户。

5bfb8d3e3071dddef681eb40b22658d7.png

AI视频赛道已变天

简单回顾一下,Pika的创始人一共有两位,郭文景(Demi Guo)和Chenlin Meng,都是斯坦福博士。

从二人学术经历来看,她们分别专注于NLP计算机视觉两个方向的AI研究,也都有生成式AI的学术经历。

这两人在AI生成领域专业背景深厚且技术过硬,以至于在团队仅有4人之时就获得了5500万美元融资。

aebf2dbcfe9d86019030ee53a05119ac.png

Pika亮相的时机不可谓不妙,从去年11月开始,一个月内就有5家AI视频生成产品发布或迎来重大更新。

主要包括:

  • 11月3日,Runway的Gen-2发布里程碑式更新,支持4K超逼真的清晰度作品。

  • 11月16日,Meta发布Emu Video,这个工具在用户评估中号称打败Gen-2、Pika等对手。

  • 11月18日,字节发布PixelDance,作品的动态性可谓史无前者,画面中的元素动作幅度都相当大,且不变形,让人眼前一亮。

  • 11月21日,Stable AI也推出了自家的视频工具Stable Video Diffusion

  • 同在21日,Gen-2上线“涂哪动哪”的运动笔刷新功能,这是生成模型可控性上的一个重要里程碑。

接下来就是Pika在11月29日发布正式版1.0,叫板“老大哥”Runway。

可以说,Pika正是在人们将目光狂热转向视频生成领域时横空出世的,可谓赶上了风口。

但没人预料的到,新年伊始,OpenAI“杀手级”视频生成模型Sora发布,将视频生成的质量拉高了一个档次,时长也拉到了60秒。

Sora的热度盖过了一切,行业后来者也必须得卷起来了。

4月7日,GitHub开源了视频生成模型StreamingT2V,能够生成1200帧、时长120秒的长视频。

紧随其后,4月29日,清华大学与生数科技联合发布了Vidu,画面效果对标Sora,长度可达16秒,还能读懂物理规律。

然后就是谷歌在5月14日的开发者大会上发布了Veo,对标Sora能生成一分钟长视频。

总之,AI视频生成在技术上愈发成熟,也因此带动了行业投融资风潮。

仅在2024年3月一个月,就有三个华人创立的AI视频生成创企获得了融资,且融资额都过了千万美金

  • 3月7日,总部位于英国伦敦的Haiper(由两位前DeepMind团队的华人工程师建立)宣布产品上线,并已经完成1380万美金融资。

  • 3月13日,由前字节跳动视觉技术负责人创立的爱诗科技,完成一亿元人民币(约合1380万美金)左右的A1轮融资。

  • 3月24日,凭借让霉霉说中文视频火起来的AI数字人产品HeyGen(由前Snap软件工程师徐卓创立)完成一轮6000万美元的融资。

  • 4月23日,爱诗科技完成A2轮超亿元融资,由蚂蚁集团领投。

  • 6月1日,Runway获得1亿美元D轮融资,由谷歌领投。

就在6月5日,生数科技宣布完成数亿元Pre-A轮融资,由北京市人工智能产业投资基金、百度联合领投。

不难看出,AI视频生成今年将迎来新的爆发,而作为顶流之一,Pika自然有人关注。

53d5d9b3648aaeb1b62767cb41dc9388.png

且Pika现在声称他们已经构建起了自己的“基础模型”,因此不会依赖其他AI公司的技术。

虽然需要不少资金来训练模型,但创始人郭文景透露Pika在这块不需要消耗大量的资金,他们有点类似法国的Mistral AI,可以在较少资金的情况下也能训练出比较好的模型,不过具体没有透露。

最后,今天正值Pika一周年生日(从创始人休学创办Pika开始计算),官方也放出了纪念视频。

接下来,Pika计划在今年晚些时候发布其文本转视频模型的重大更新,这包括两方面,一个是提供更高质量、更长的视频,另一个是确保输出的一致性。

据创始人郭文景透露:

Pika的新工具可以让用户定义一个对象或角色,然后在视频中或最终在不同的剪辑中一致地生成它。

那么,你看好这家公司吗?欢迎在评论区留言讨论。

参考资料:
[1]https://arxiv.org/abs/2311.17082
[2]https://x.com/GoogleDeepMind/status/1790894262193988022
[3]https://streamingt2v.github.io/
[4]https://x.com/pika_labs/status/1797091532455248224
[5]https://pika.art/blog
[6]https://www.washingtonpost.com/technology/2024/06/04/pika-funding-openai-sora-google-video/
[7]https://www.bloomberg.com/news/articles/2024-06-05/spark-capital-jared-leto-back-ai-video-startup-pika

量子位年度AI主题策划正在征集中!

欢迎投稿专题 一千零一个AI应365行AI落地方案

或与我们分享你在寻找的AI产品,或发现的AI新动向

08170bc5c9278c2c70a0ee79cc38d781.png

点这里

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/知新_RL/article/detail/692611
推荐阅读
相关标签