赞
踩
https://nju-pcalab.github.io/projects/openvid
OpenVid-1M是一个大规模、高质量的文本到视频(Text-to-video, T2V)数据集,旨在推动T2V生成领域的研究。该数据集包含超过一百万段具有高美学标准、清晰度和表达性字幕的视频片段。它解决了现有数据集质量不高或体积过大不适合大多数研究机构使用的问题,并强调了充分利用文本信息的重要性。
文本到视频(T2V)一代最近引起了极大的关注,这主要是由于先进的多模态模式Sora。然而,目前研究界的T2V一代仍然面临两大挑战:1)缺乏精确的、高质量的开源数据集。以前流行的视频数据集,如WebVid
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。