众包和用户研究(Crowdsourcing and user studies):诸如局部定位和属性之类的注释为新的研究机会打开了大门,但与对象类标签相比,它们还受到更大程度的注释错误和用户主观性的影响。 通过MTurk用户对每个训练图像发布注释,我们希望鼓励众包技术的研究,以结合多个用户的注释,并促进用户研究评估不同类型注释的可靠性和相对价值。
四、基准和基准实验
我们介绍了一组基准和基准实验,用于研究鸟类的分类,检测和局部定位:
1.已定位的物种分类(Localized Species Categorization):给定“ground truth”局部定位,将每个图像分配给200种鸟类中的一个类。 此基准旨在促进对不同定位模型的研究(例如,定位信息在多大程度上提高了分类准确性?),还为现有分类算法提供了更大的可访问性。 使用RGB颜色直方图和带有线性SVM的矢量量化SIFT描述符的直方图,我们获得了17.3%的分类精度,参见图7(d)。