赞
踩
神经网络的研究重点从算法的研究过度到合适(suitable)且大量训练数据的创建。传统的计算机视觉任务通过人工标注的网络数据来获得训练集。对于光流和场景流问题,由于无法人为进入每个像素精确光流场的限制,所以通过人工标注数据集的方法不可行。此论文提倡使用合成数据集来训练神经网络,并以此实现光流以及场景流的计算。此论文利用不同的合成训练集来训练神经网络,并评估了不同合成训练集对于网络泛化能力的影响。最后证明了在训练的不同阶段,使用不同类型的合成数据集,能够增强网络的泛化能力。
众多学者通过创建例如ImageNet,MS COCO ,CityScapes 来完成目标检测以及分类任务。NYU 数据集包含RGB-D 图片,并以此训练神经网络,使得从一张单一图片中估计出深度信息成为可能。
本文发现:
1.训练集不需要和现实场景相同,
2.训练的不同阶段使用不同的训练集得到的效果 大于 单纯使用单一数据集,以及混合数据集。
3.增强数据集的现实性,比如复杂的光照条件,不会显著的提高神经网络的性能,即使测试集中有光照条件。
4.模拟相机在拍摄训练集中存在的缺陷,会提高网络对于此相机拍出照片的泛化效果。
由于模拟相机运动的影响,背景也需要随机变换,因为运动的参数确定,所以光流真实值也随之确定
使用人为建模获得合成图片(3D模型渲染法)
Monkaa数据集中包含非刚性运动以及复杂的动物皮毛。和Sintel数据集一样,也遇到了很多问题,例如焦距等。这些问题限制了可用场景的数量,使得这种方法不能随意放缩以产生更多数据。
横坐标为像素移动的距离,纵坐标为统计像素占总数据集的比重 ,例如FlyingChairs像素移动为0的占总像素点的1/10。
可以看出FlyingChairs的运动统计和Sintel的运动统计及其类似,所以可以写成Sintel-Like。
可以看到训练集分布和测试集分布类似,那么取得得效果会好。发现这种情况同样令人失望,因为我们想要一种通用的网络,可以同时处理多种位移分布情况。通过使用学习策略,以及特殊网络的堆叠,可以减轻 训练集分布对测试集的影响。
实验部分:渲染了3种不同的设置,无阴影(shadeless),静态(static),动态(dymamic)
测试结果
实验表明神经网络能够发现训练集中复杂的光照情况 来使得在测试集上表现良好。光照的影响,不过是在目标表明增加特征点。动态数据对于结果影响较小,因为在图片中的加亮部分是稀疏的。实验还发现在动态数据上训练的网络无法分辨 无阴影以及静态数据,以至于在对应测试集上表型糟糕,所以使用动态数据训练的神经网络在Sintel上表现糟糕,Sintel中大多数是静态的目标。
然而针对数据增强的缺点,最好的方法还是获得尽量多的训练集以及使用数据增强。
通过比较两幅视差图的差异,可以看到使用degraded FlyingThings3D数据训练的网络能够有效处理拜尔器件的影响,这些影响主要集中在轮廓。
这对 高等级的任务,例如目标识别可能不适用。有必要联合处理高等级任务以及低等级任务,以后有必要创建一种数据集,可以同时处理高等级任务以及低等级任务。并且寻找一种学习过程,能够有效的组合真实世界图片与合成图片的优势。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。