文生视频大模型Sora爆火出圈，景联文科技上新百万段视频描述数据集！

作者：很楠不爱3 | 2024-03-03 03:01:53

踩

2024年2月15日，OpenAI发布人工智能文生视频大模型Sora。

Sora是基于OpenAI的DALL-E模型开发的视频生成技术，能根据文本描述创建最长60秒的逼真视频。包括多个角色、特定类型动作和主题背景；在单个生成的视频中创建多个镜头，可以模拟复杂的摄像机运镜，同时准确地保持角色和视觉风格；可以深度模拟真实物理世界，继承DALL-E 3的高画质和指令遵循能力，理解用户需求。

Sora的技术原理

Sora的技术原理主要基于深度学习和分布式训练技术。Sora采用了扩散型变换器（diffusion transformer）架构，这是一种深度学习模型，能够将随机噪声逐渐转化为有意义的图像或视频内容。

Sora采用了分布式训练的方式，将AI模型的训练任务拆分成多个子任务，并在多个节点上并行执行。采用数据并行和模型并行的策略，以及自定义的通信协议，以实现节点之间的高效通信。

这些技术原理使得Sora能够生成高质量的视频内容，并在模拟数字世界、长期连续性和物体持久性等方面展现出强大的能力。

高质量、大规模、描述精细的视频描述数据已成为Sora模型学习重要的一环。

景联文科技是大语言模型数据供应商，可为文生视频大模型提供大量高质量数据，提高大模型的准确性和性能。自有大规模、高质量视频描述成品数据集近百万段，内容涵盖广泛。

视频描述数据集

数据规模为百万段视频及文本描述，涵盖多种通常场景。针对视频内容，采取简述和复杂描述两种标注方式，首先对视频整体内容进行简要概括。随后，确定视频中内容发生变化的具体时间点，并对每个时间段的子视频进行详细的内容描述。

为确保业务操作的安全性和合规性，满足不同业务场景下的数据保护需求，景联文科技有一套全面的数据安全与合规管理方案，涵盖版权数据产品、数据定制服务的私有化部署。

景联文科技还提供大语言模型训练数据的标注服务，建立了一系列数据分发、清洗、标注、质检、交付的标准化操作流程。

为全球数千家人工智能从业公司和高校科研机构交付海量、高质量的AI大语言模型训练数据。

景联文科技｜数据采集｜数据标注｜多模态数据集

助力人工智能技术，赋能传统产业智能化转型升级

文章图文著作权归景联文科技所有，商业转载请联系景联文科技获得授权，非商业转载请注明出处。

声明：本文内容由网友自发贡献，不代表【wpsshop博客】立场，版权归原作者所有，本站不承担相应法律责任。如您发现有侵权的内容，请联系我们。转载请注明出处：https://www.wpsshop.cn/w/很楠不爱3/article/detail/183565