赞
踩
目录
IoU loss提出前,大家主要通过4个坐标点独立回归Bounding box(bbox,边界框),这样做的缺点有:
1. 目标检测的评价方式是使用IoU,而实际回归坐标框的时候使用4个坐标点,二者是不等价的,如下图所示;
2. L1或者L2 Loss相同的框,其IoU 不是唯一的
3. 通过4个坐标点回归坐标框的方式,是假设4个点相互独立的,没有考虑其相关性,实际4个坐标点具有一定的相关性
4. 基于L1和L2的距离的loss对于尺度 不具有 不变性
参考链接:https://blog.csdn.net/weixin_45377629/article/details/124911293
考虑了bounding box 左上角和右下角坐标的关联性。
即先求出2个框的 IoU
,然后再求
缺点:
如果两个框没有相交,根据定义,IoU=0,不能反映两者的距离大小(重合度)。同时因为loss=0,没有梯度回传,无法进行学习训练。
Generalized IoU
先计算两个框的最小闭包区域面积(即同时包含了预测框和真实框的最小框的面积,下图虚线的外接矩形),再计算出IoU,随后计算闭包区域中不属于两个框的区域占闭包区域的比重,最后IoU减去这个比重,得到GIoU。
特点:
1. 与 IoU 相似,GIoU 也是一种距离度量,满足损失函数的基本要求;
2. GIoU对scale不敏感;
3. GIoU 是 IoU 的下界,在两个框无限重合的情况下,IoU = GIoU = 1;
4. IoU 取值 [0,1],但 GIoU 有对称区间,取值范围 [-1,1]。在两者重合的时候取最大值1,在两者无交集且无限远时取最小值-1,因此 GIoU 是一个非常好的距离度量指标。
5. 与 IoU 只关注重叠区域不同,GIoU 不仅关注重叠区域,还关注其他的非重合区域,能更好的反映两者的重合度。
Distance-IoU
DIoU 要比 GIoU 更加符合目标框回归的机制,将目标与 anchor 之间的距离,重合率以及尺度都考虑进去,使得目标框回归变得更加稳定,不会像 IoU 和 GIoU 一样出现训练过程中发散等问题。
其中,,, 分别代表了预测框和真实框的中心点, 代表的是计算两个中心点间的欧氏距离的平方。 代表的是能够同时包含预测框和真实框的最小闭包区域的对角线距离。
优点:
1. 与 GIoU loss 类似,DIoU loss 在与目标框不重叠时,仍然可以为边界框提供移动方向;
2. DIoU loss 可以直接最小化两个目标框的距离,因此比 GIoU loss 收敛得更快;
3. 对于包含两个框在水平方向和垂直方向上这种情况,DIoU loss 可以回归得更快,而 GIoU loss 几乎退化为 IoU loss;
4. DIoU 还可以替换普通得 IoU 评价策略,应用于 NMS 中,使得 NMS 得到的结果更加合理和有效。
Complete-IoU
考虑到 bounding box 回归三要素中的长宽比还未被考虑到计算内,因此,在 DIoU 的基础上提出了 CIoU。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。