当前位置:   article > 正文

景联文科技以高质量多模态数据集赋能AI大模型,精准匹配提升模型性能_jinglianwen科技

jinglianwen科技

人工智能的浪潮中,语料数据如同建筑的基石,其质量、规模和运用策略直接决定了AI模型的表现和应用的广泛性。

景联文科技在AI领域深耕多年,打磨了高质量多模态数据集,致力于为不同训练阶段的算法精准匹配高质量数据资源。

3000万张图像数据集

数据详情:3000万张图像,图像内容来源于真实世界;图像内容合法合规,不涉及敏感数据。

图片规格:7680*4320以上,长宽比∈[0.5,2],PNG、JPG格式。

图像质量:纹理细节丰富;图像信噪比高,噪声低;图像无水印;风格真实,色调自然;图像内容干净无歧义;构图较好,美感较好;图像边缘不出现黑框、白框,图像非黑白照;图像非拼图或合成图,纯色背景(影棚)不超过1%。

场景多样性:覆盖场景包括动物,植物,建筑,建材,静物,食物,人像; 动物,植物,建筑,建材,静物,食物,人像类别占比超过80%,且各个类别分布相对均匀。

光照条件:正常光照条件下(非阴天、逆光、夜景)拍摄的图像,或者摄影专用灯光环境下拍摄图片。

图像标签:提供图像的场景描述/内容主体类别描述;光照分类标签;提供拍摄信息描述:拍摄角度(例如微距特写,广角、正面、侧拍、俯拍等);提供相机参数描述,包含光圈信息(f14,f16,f22等),滤镜信息(渐变滤镜,色彩滤镜,UV滤镜等),曝光信息(双重曝光,多重曝光等),焦段信息(24mm,35mm等)等,exif信息不做强制要求。

100万条特写视频数据集

数据数量:100万条视频

数据格式:短边分辨率≥1080P,mp4、mkv格式。

数据多样性:

1)人物:全身/半身/脸部表情特写

2)风景:自然景观、气候

3)动物:萌宠、动物特写、类似《动物世界》

4)植物:植物生长、微距镜头、昆虫

5)建筑:人文建筑运镜

100万条航拍视频数据集

数据详情:100万条视频

1)俯拍视角数据:自然风景、城市人文风景

2)跟随环绕画面

3)无人机及穿越机穿梭视角数据

数据格式:短边分辨率≥1080P,mp4、mkv格式。

画面内容:  

1.有镜头语言:推、拉、摇、移、升、降、跟随、环绕、变焦等大幅度运镜,画面流畅无抖动。

2.光线充足不欠曝或过曝,噪声低,画质锐利,色彩正确(非黑白无偏色)。

   

200万条虚拟渲染视频

数据详情:200万条视频

数据格式:短边分辨率≥1080P,mp4、mkv格式;

画面内容: 

1.非固定视角,视角环绕人物(人物静止、人物运动)、视角跟随人物 (第三人称);物体/场景:视角环绕物体、视角在场景中穿梭。

2.光线充足不欠曝或过曝,噪声低,画质锐利,色彩正确(非黑白无偏色)。

在数据安全与合规方面,景联文科技已通过ISO9001质量、ISO27001信息安全、ISO27701国际隐私安全管理认证,积极参与8项国家数据交换格式和数据安全标准制定,牢固构筑数据保护的基石。

获取样例请登录景联文科技官网咨询客服。https://www.jinglianwen.com/ai/

或直接发送需求至邮箱:lx@jinglianwen.com

景联文科技|数据采集|数据标注|多模态数据集

助力人工智能技术,赋能传统产业智能化转型升级

文章图文著作权归景联文科技所有,商业转载请联系景联文科技获得授权,非商业转载请注明出处。

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/煮酒与君饮/article/detail/1021334
推荐阅读
相关标签
  

闽ICP备14008679号