前言
2024 年已经过半,生成式 AI 技术已经从最初的探索阶段过渡到应用实践阶段。无论是国外的 OpenAI、谷歌、苹果等顶尖 AI 公司,还是国内的百度、阿里云、字节跳动、腾讯等科技大厂,以及诸如百川智能、零一万物等 AI 独角兽公司,都在积极展示他们的最新 AI 成果。不约而同地,这些公司都将焦点放在了大模型的产业应用上。
1.国外 AI 发展
- OpenAI: OpenAI 自从推出了 GPT 系列模型以来,一直在不断探索和扩展生成式 AI 的应用领域。GPT-4 和未来的版本预计会在自然语言处理、代码生成、医疗诊断等多领域进一步发挥作用。OpenAI 期望通过与更多企业合作,将生成式 AI 深度融入各行各业。
- 谷歌: 谷歌在生成式 AI 上投入巨大,特别是在其 Bard 和 LaMDA 模型的研发上。谷歌云 AI 也为企业提供了强大的 AI 工具支持,期望通过云服务将 AI 技术普及到更多的商业应用中。
- 苹果: 苹果的生成式 AI 主要体现在 Siri 和各种智能设备的应用中。随着对隐私和安全的持续重视,苹果期望能在保证用户隐私的前提下,提供更加智能化和个性化的用户体验。
2.国内 AI 公司发展
- 百度: 百度的大语言模型文心一言已经在多个领域落地应用,包括搜索引擎优化、智能客服和内容生成等。百度期望通过持续改进模型性能,进一步拓展 AI 的商业应用场景。
- 阿里云: 阿里云在生成式 AI 领域也有了显著进展,特别是在其达摩院的支持下,推出了多个 AI 应用平台。阿里云期望通过云计算和 AI 的结合,推动更多企业实现智能化转型。
- 字节跳动: 字节跳动利用生成式 AI 技术在内容创作和推荐系统上取得了巨大成功。特别是在抖音平台上,AI 被广泛用于视频生成和用户匹配。未来,字节跳动期望继续深耕内容生成领域,推动更多创新应用。
- 腾讯: 腾讯在生成式 AI 方面的应用主要集中在社交媒体和游戏领域。通过 AI 技术,腾讯希望能在用户互动和游戏体验上提供更多创新功能,增强用户粘性。
- 百川智能和零一万物: 作为 AI 独角兽,百川智能在智能制造和自动化领域有着突出的表现,而零一万物则在医疗和金融科技领域展现了其独特的 AI 技术。两家公司期望通过不断创新,进一步推动特定领域的智能化进程。
3.国内AI视频行业的竞争格局
快手可灵的崛起
快手推出的AI视频工具“可灵”迅速成为行业焦点。该工具能够自动生成多样化的短视频内容,极大地丰富了用户的社交媒体体验。可灵背后的团队是一群来自国内外顶尖高校的精英,他们的专业知识和创新能力是推动项目成功的关键。
发布一个月,体验用户超30万,生成700+万条短视频,开放网页Web端。哪怕这样,可灵还是一号难求,想上手体验的急得嗷嗷的。
竞争加剧
前脚快手高调发布可灵,后脚 Luma 不甘示弱,推出最新视频模型 Dream Machine,紧接着 Runway 横插一脚,祭出 Gen-3 这个大杀器。
在微妙的 FOMO 气氛带动下,更多玩家秉持着「累死自己,卷死同行」的宗旨,一头扎进这个赛道
阿里巴巴达摩院押注「寻光视频创作平台」、字节即梦 AI 探索「生成式影剧」、美图 MOKI 盯上 AI 短片创作、Haiper AI 则聚焦创意表达 ……
其他AI视频巨头:
- Luma:作为AI视频技术的重要竞争者,Luma推出的“Dream Machine”模型通过更高效的数据处理和增强的生成算法提供了改进的视频质量,这表明了Luma在市场上的竞争力。
- Runway:引入了Gen-3视频模型,该模型通过利用先进的深度学习技术优化视频生成过程,提高了生成效率和质量。
- 阿里巴巴达摩院:其“寻光视频创作平台”聚焦于通过自动化工具减少视频制作的时间成本,旨在为企业和创作者提供更快的内容创作解决方案。
- 字节跳动即梦AI:探索生成式影剧,开拓AI在电影和电视剧制作中的应用,力求通过技术创新改变传统的影视制作流程。
- 美图MOKI:专注于短片创作,将AI技术与其在图像处理领域的专长结合,推动短视频内容的创新和多样化。
- Haiper AI:专注于提供创意表达的新工具,使艺术家和创作者能够通过新技术探索不同的视觉表达方式。
- ......
Kimi、豆包:字节跳动的浏览器插件
Kimi豆包 是字节跳动推出的最新AI产品,这是一个浏览器插件,旨在通过集成人工智能技术提高浏览器的智能化和用户体验。该插件利用字节跳动强大的AI算法来提供一系列增强功能,包括但不限于智能搜索、内容推荐、以及自动化的网页内容概要。
截止7月15日,Chrome商店显示,豆包浏览器插件的下载量已突破了9万次,Kimi浏览器插件的下载量刚刚破2万。
而AI产品榜显示,今年6月,Kimi的用户访问量为豆包的近4倍。
卷大模型在浏览器插件中的应用
随着AI技术的迅猛发展,浏览器插件已成为AI大模型应用的新战场。字节跳动的Kimi豆包就是一个典型的例子,它不仅提高了用户体验,还展示了大模型技术(如自然语言处理和机器学习)在实际应用中的潜力和灵活性。
Kimi豆包的成功上线标志着字节跳动在AI应用开发方面迈出了重要一步。展望未来,随着AI技术的进一步成熟和用户需求的持续增长,可以预见,更多类似的智能插件将陆续出现,不仅仅限于信息搜索和内容推荐,还可能扩展到在线教育、电子商务等多个领域。这将进一步推动互联网服务的智能化,为用户带来更加丰富和便捷的网络体验。
4.行业活动和论坛
2024年7月5日,在上海世博展览馆H3馆X会议室举办的“2024 WAIC 视频生成前沿技术论坛”是该领域一年一度的重要事件。本次论坛由世界人工智能大会组委会办公室主办,机器之心和东浩兰生共同承办。会议集合了来自全球的AI研究者、技术开发者和行业领导者,共同探讨视频生成技术的最新进展和未来趋势。
一位来自著名AI研究机构的专家强调,随着计算能力的提高和算法的进步,未来的视频生成技术将更加智能和高效,能够在保持创造性的同时,大幅度降低内容生产的成本和时间。
2024 WAIC 视频生成前沿技术论坛不仅展示了最新技术成果,还为业内专家和参与者提供了一个交流和合作的平台,共同探讨如何推动视频生成技术向更广泛的应用领域拓展。此次论坛加深了参与者对视频生成技术当前能力及其未来发展潜力的理解,为行业的进一步创新和合作奠定了基础。
5.结论
各大AI公司和国内大厂在AIGC领域的投入标志着这一技术的成熟与广泛应用。未来,随着技术的进一步发展,AIGC将在更多行业中发挥关键作用,推动社会和经济的全面智能化。