当前位置:   article > 正文

赛事 | 总奖金池超12万美金!CVPR 2024国际挑战赛6月1日截止报名!

赛事 | 总奖金池超12万美金!CVPR 2024国际挑战赛6月1日截止报名!

714b10c4a30127902087f09d44624535.gif

39bab4700224151417ef2f553db98c97.png

9cbc869de6eea26fdbebd569e41502d4.jpeg

e2cd81ceeaf821c9eb1384574e948e90.png

新赛题

七大赛道,赛题新颖,全方位覆盖相关领域最新最热话题,充分挖掘大模型在自动驾驶及具身智能垂直领域中的应用。

024ce49f1247acf289cd426a064b1058.png

高奖金

总奖金池超过12万美金,单赛道最高奖金可达2.7万美金。据不完全统计,在本届CVPR一百多个论坛中,奖金额度位列榜首。

b32383679dc615cddb3bc4c2296f1afc.png

重原创

加强基础研究探索,坚持四个面向,以原创性与科学研究价值作为参赛主要衡量指标,并不单靠成绩排名,采取原创方案加性能指标两者结合的方式进行综合排序。

2024年3月1号,CVPR 2024 国际挑战赛正式启动。本次挑战赛由上海人工智能实验室主办,并联合多家国内外机构共同举办。多位国内外知名专家学者组成赛事指导与评奖委员会。本次比赛共设七个赛道,获胜者有机会获得高达两万七千美金奖励,还有机会受邀在国际顶级期刊投稿。我们还为每个赛道准备了详细的参赛指引及基准模型,点击每个赛道对应链接即可访问。

比赛官网:

https://opendrivelab.com/challenge2024

主活动:

CVPR 2024论坛 - Workshop on Foundation Models for Autonomous Systems (Seattle, USA)

相关活动:

四月下旬:

  • 第三届中国三维视觉大会(China3DV 2024)

  • http://www.csig3dv.net/2024/competition.html

六月中旬:线下活动(北京/上海)

01

赛题介绍

端到端自动驾驶

由于先前数据集规模有限、开环和闭环指标不一致等原因,导致难以使用真实数据对感知运动驱动策略进行基准测试。此赛道将使用大规模数据弥合两种评估范式之间的差距,并通过在短时序范围内的BEV抽象建模,实现高效开环评测,同时更好地与闭环评估保持一致。

赛道信息:

https://opendrivelab.com/challenge2024/#end_to_end_driving_at_scale

数据量:

约2T

测试服务器:

https://huggingface.co/spaces/AGC2024-P/e2e-driving-2024

fb80a20904b88a38d4b7bcafeb7f1bc1.jpeg

世界模型

作为现实的抽象时空表征,世界模型可根据观测到的当前状态预测未来状态,对世界模型的学习将促进基础模型性能提升至新水平。模型需要在只有视觉输入的情况下,预测出未来时刻的点云,以证明其对世界的预测能力。

赛道信息:

https://opendrivelab.com/challenge2024/#predictive_world_model

数据量:

约2T

参考训练时间:

样本数据8卡A100,3天

测试服务器:

https://huggingface.co/spaces/AGC2024-P/predictive-world-model-2024

9e1ecbada8311466ef3d85cd1503196f.jpeg

占据栅格和运动估计

三维框往往不足以描述一般物体,受机器人学概念的启发,可将感知表征描述成对栅格化三维空间的占据情况预测。在这个赛道中,参赛者不仅要给出三维空间的栅格化表示,还须给出栅格的运动预测。

赛道信息:

https://opendrivelab.com/challenge2024/#occupancy_and_flow

自动驾驶挑战赛@China3DV :

https://huggingface.co/spaces/China3DV-S/occupancy-and-flow-2024

数据量:

约70GB

参考训练时间:

8卡 3090,2天

测试服务器:

https://huggingface.co/spaces/AGC2024-S/occupancy-and-flow-2024

82143231cb23c49f05c97a1be9adea57.jpeg

具身多模态三维视觉定位

相比驾驶场景,室内的具身三维感知系统面对的是包含语言指令的多模态输入、更复杂的语义理解、更多样的物体类别和朝向,以及大不相同的感知空间和需求。基于此,大赛构造了一套第一视角的多模态全场景三维感知工具包 EmbodiedScan。这项任务的目标是,给定关于特定物体的语言描述,检测出目标物体的类别以及带朝向的三维框。 

赛道信息:

https://opendrivelab.com/challenge2024/#multiview_3d_visual_grounding

数据量:

约1.5T,比赛直接相关数据约 300G

参考训练时间:

参考训练时间:样本数据 4卡 A100 0.5天,全量数据 8卡 A100 1.5天

测试服务器:https://huggingface.co/spaces/AGC2024/visual-grounding-2024

b5f164844e14e911c15524fcb4c2c8e2.jpeg

CARLA自动驾驶挑战赛

CARLA自动驾驶挑战要求车辆通过一组预先定义的路线。车辆行驶路线中涉及复杂的情况,如高速公路、城区、住宅区和乡村等环境,同时包含日光、日落、夜晚以及雨、雾等光照和天气变量,为自动驾驶系统的闭环评测提供了可能。

赛道信息:https://opendrivelab.com/challenge2024/#carla

测试服务器:https://eval.ai/web/challenges/challenge-page/2098/overview

409ec4027a83e5cf2893fb51b66e8adf.jpeg

大语言模型在自动驾驶中的应用

通过引入语言信息,DriveLM数据集将大语言模型与自动驾驶系统连接起来,并最终通过引入语言的推理能力做出决策,确保规划的可解释性。以多视角图像为输入信息,模型须回答涉及驾驶的多方面问题。

赛道信息:https://opendrivelab.com/challenge2024/#driving_with_language

数据量:

训练集4072帧,测试集799帧,每帧约90个问答对

参考训练时间:

8卡V100,1天

测试服务器:

https://huggingface.co/spaces/AGC2024/driving-with-language-2024

edd12faa5dd9709064b5417ba362ff7f.jpeg

无图驾驶

在没有高精地图的情况下,自动驾驶汽车需要高水平的场景理解能力,本赛道旨在探索场景推理能力的极限。将多视角图像和标清地图作为输入信息,神经网络不仅要输出车道和交通元素的感知结果,同时还须输出车道之间、车道和交通元素之间的拓扑关系。

赛道信息:

https://opendrivelab.com/challenge2024/#mapless_driving

自动驾驶挑战赛@China3DV :

https://huggingface.co/spaces/China3DV/mapless-driving-2024

数据量:

约200G

参考训练时间:

8卡V100,1天

测试服务器:

https://huggingface.co/spaces/AGC2024/mapless-driving-2024

63763ca0bc029f1cc2ab73d5b894d605.jpeg

02

赛程安排

以下时间均为北京时间,详情请参照大赛官方网站

2024年3月1日

01

参赛报名

2024年3月1日

02

比赛正式开始

2024年3月25日

03

测试服务器开放

2024年6月1日

04

测试服务器关闭

2024年6月18日

05

比赛结果公布

03

指导与评奖委员会

*按照姓名笔画排序;名单持续更新中。

乔宇

上海人工智能实验室

领军科学家,主任助理

刘青山

南京邮电大学

副校长

杨小康

上海交通大学

人工智能研究院执行院长

李升波

清华大学

车辆学院党委书记,国家高层次领军人才,教授

张亚勤

清华大学

中国工程院外籍院士,智能产业研究院院长,讲席教授

陈宝权

北京大学

智能学院副院长,博雅特聘教授

夏华夏

美团

首席科学家,副总裁

高新波

重庆邮电大学 

党委副书记,校长,教授

薛建儒

西安交通大学

人工智能与机器人研究所教授

_

点击“阅读原文”或访问以下链接即可了解详情

https://opendrivelab.com/challenge2024

联系邮箱

workshop-e2e-ad@googlegroups.com

微信交流群                  报名链接

f506ff99b0296b527538161afd57bf3c.jpeg

cbfcc4f110b8f8dc58be25082363b127.gif

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/AllinToyou/article/detail/513115
推荐阅读
相关标签
  

闽ICP备14008679号