赞
踩
SoccerNet: A Scalable Dataset for Action Spotting in Soccer Videos:论文传送门
这篇文章研究的任务是足球比赛视频中的事件分类,还有定位指定事件发生的时间点或时间段内。研究背景是足球比赛都会有很多摄像机来进行视频的捕捉,这些视频其实是非常有价值的,不仅仅是广播大众,它还可以被用来针对某个球队或者球员进行数据分析,所以一般这时候就要对大量的视频进行剪辑,一般这种剪辑的操作都是人工进行的,这是非常耗时耗力的,所以这篇文章针对这个问题提出了解决方案。 文章的贡献主要有以下三点:首先提出了一个新的任务:在足球视频中定位事件,其中事件定义为固定在视频中单个时间戳上的动作(这个翻译的不好,直接看下面的ppt理解吧~~);其次,文中提出了一个可扩展的足球视频理解数据集——SoccerNet,这个数据集中包含了764小时的足球比赛视频,这些视频包含被分成三种类别(进球、黄/红牌、换人)的6637个实例;第三点是针对视频块分类和事件发现这两个任务为数据集提供了基准,文中的分钟分类器的性能达到了67.8%(MAP),事件定位器的平均性能达到了49.7%。
通过上面的介绍我们知道这篇文章的任务是两个:一个是针对视频块进行分类,还有一个就是对视频中特定的事件进行定位。第一个任务相对来说好理解、好执行一点,常规的操作就是提取这个视频块的特征,将其整合、降维,最后用来分类,而第二个任务相对来说难执行一点,因为事件这个概念很难量化。所以文章首先针对事件和在足球视频中发现事件任务这两个概念进行了定义。