当前位置:   article > 正文

非极大值抑制详细原理(NMS含代码及详细注释)_非极大值抑制算法原理

非极大值抑制算法原理

作者主页:爱笑的男孩。的博客_CSDN博客-深度学习,YOLO,活动领域博主爱笑的男孩。擅长深度学习,YOLO,活动,等方面的知识,爱笑的男孩。关注算法,python,计算机视觉,图像处理,深度学习,pytorch,神经网络,opencv领域.https://blog.csdn.net/Code_and516?type=collect

个人介绍:打工人。

分享内容:机器学习、深度学习、python相关内容、日常BUG解决方法及Windows&Linux实践小技巧。

如发现文章有误,麻烦请指出,我会及时去纠正。有其他需要可以私信我或者发我邮箱:zhilong666@foxmail.com

目录

非极大值抑制原理 

NMS源码含注释

需要的依赖包

nms算法

绘图

全部代码

效果图


非极大值抑制原理 

        非极大值抑制(Non-Maximum Suppression,NMS)是一种图像处理中的技术。它通常用于目标检测中,其主要作用是去除检测出来的冗余框,只保留最有可能包含目标物体的框,保留最优的检测结果。

        在目标检测中,我们通常使用一个检测器来检测出可能存在的物体,并给出其位置和大小的预测框。然而,同一个物体可能会被多次检测出来,从而产生多个预测框。这时,我们就需要使用NMS来去除掉这些重叠的框,只保留最优的一个。

        其基本原理是先在图像中找到所有可能包含目标物体的矩形区域,并按照它们的置信度进行排列。然后从置信度最高的矩形开始,遍历所有的矩形,如果发现当前的矩形与前面任意一个矩形的重叠面积大于一个阈值,则将当前矩形舍去。使得最终保留的预测框数量最少,但同时又能够保证检测的准确性和召回率。具体的实现方法包括以下几个步骤:

  1. 对于每个类别,按照预测框的置信度进行排序,将置信度最高的预测框作为基准。

  2. 从剩余的预测框中选择一个与基准框的重叠面积最大的框,如果其重叠面积大于一定的阈值,则将其删除。

  3. 对于剩余的预测框,重复步骤2,直到所有的重叠面积都小于阈值,或者没有被删除的框剩余为止。

        通过这样的方式,NMS可以过滤掉所有与基准框重叠面积大于阈值的冗余框,从而实现检测结果的优化。值得注意的是,NMS的阈值通常需要根据具体的数据集和应用场景进行调整,以兼顾准确性和召回率。

        总结来说,非极大值抑制原理是通过较高置信度的目标框作为基准,筛选出与其重叠度较低的目标框,从而去除掉冗余的目标框,提高目标检测的精度和效率。

NMS源码含注释

需要的依赖包

import numpy as np 
import matplotlib.pyplot as plt
#安装
#pip install numpy==1.19.5 -i https://pypi.tuna.tsinghua.edu.cn/simple/
#pip install matplotlib==3.2.2 -i https://pypi.tuna.tsinghua.edu.cn/simple/ 

nms算法

  1. #nms 算法
  2. def py_cpu_nms(dets, thresh):
  3. #边界框的坐标
  4. x1 = dets[:, 0]#所有行第一列
  5. y1 = dets[:, 1]#所有行第二列
  6. x2 = dets[:, 2]#所有行第三列
  7. y2 = dets[:, 3]#所有行第四列
  8. #计算边界框的面积
  9. areas = (y2 - y1 + 1) * (x2 - x1 + 1) #(第四列 - 第二列 + 1) * (第三列 - 第一列 + 1)
  10. #执行度,包围盒的信心分数
  11. scores = dets[:, 4]#所有行第五列
  12. keep = []#保留
  13. #按边界框的置信度得分排序 尾部加上[::-1] 倒序的意思 如果没有[::-1] argsort返回的是从小到大的
  14. index = scores.argsort()[::-1]#对所有行的第五列进行从大到小排序,返回索引值
  15. #迭代边界框
  16. while index.size > 0: # 6 > 0, 3 > 0, 2 > 0
  17. i = index[0] # every time the first is the biggst, and add it directly每次第一个是最大的,直接加进去
  18. keep.append(i)#保存
  19. #计算并集上交点的纵坐标(IOU)
  20. x11 = np.maximum(x1[i], x1[index[1:]]) # calculate the points of overlap计算重叠点
  21. y11 = np.maximum(y1[i], y1[index[1:]]) # index[1:] 从下标为1的数开始,直到结束
  22. x22 = np.minimum(x2[i], x2[index[1:]])
  23. y22 = np.minimum(y2[i], y2[index[1:]])
  24. #计算并集上的相交面积
  25. w = np.maximum(0, x22 - x11 + 1) # the weights of overlap重叠权值、宽度
  26. h = np.maximum(0, y22 - y11 + 1) # the height of overlap重叠高度
  27. overlaps = w * h# 重叠部分、交集
  28. #IoU:intersection-over-union的本质是搜索局部极大值,抑制非极大值元素。即两个边界框的交集部分除以它们的并集。
  29. # 重叠部分 / (面积[i] + 面积[索引[1:]] - 重叠部分)
  30. ious = overlaps / (areas[i] + areas[index[1:]] - overlaps)#重叠部分就是交集,iou = 交集 / 并集
  31. print("ious", ious)
  32. # ious <= 0.7
  33. idx = np.where(ious <= thresh)[0]#判断阈值
  34. print("idx", idx)
  35. index = index[idx + 1] # because index start from 1 因为下标从1开始
  36. return keep #返回保存的值

绘图

  1. #画图函数
  2. def plot_bbox(dets, c='k'):#c = 颜色 默认黑色
  3. # 边界框的坐标
  4. x1 = dets[:, 0] # 所有行第一列
  5. y1 = dets[:, 1] # 所有行第二列
  6. x2 = dets[:, 2] # 所有行第三列
  7. y2 = dets[:, 3] # 所有行第四列
  8. plt.plot([x1, x2], [y1, y1], c)#绘图
  9. plt.plot([x1, x1], [y1, y2], c)#绘图
  10. plt.plot([x1, x2], [y2, y2], c)#绘图
  11. plt.plot([x2, x2], [y1, y2], c)#绘图
  12. plt.title("nms")#标题

全部代码

  1. #导入数组包
  2. import numpy as np
  3. import matplotlib.pyplot as plt#画图包
  4. #画图函数
  5. def plot_bbox(dets, c='k'):#c = 颜色 默认黑色
  6. # 边界框的坐标
  7. x1 = dets[:, 0] # 所有行第一列
  8. y1 = dets[:, 1] # 所有行第二列
  9. x2 = dets[:, 2] # 所有行第三列
  10. y2 = dets[:, 3] # 所有行第四列
  11. plt.plot([x1, x2], [y1, y1], c)#绘图
  12. plt.plot([x1, x1], [y1, y2], c)#绘图
  13. plt.plot([x1, x2], [y2, y2], c)#绘图
  14. plt.plot([x2, x2], [y1, y2], c)#绘图
  15. plt.title("nms")#标题
  16. #nms 算法
  17. def py_cpu_nms(dets, thresh):
  18. #边界框的坐标
  19. x1 = dets[:, 0]#所有行第一列
  20. y1 = dets[:, 1]#所有行第二列
  21. x2 = dets[:, 2]#所有行第三列
  22. y2 = dets[:, 3]#所有行第四列
  23. #计算边界框的面积
  24. areas = (y2 - y1 + 1) * (x2 - x1 + 1) #(第四列 - 第二列 + 1) * (第三列 - 第一列 + 1)
  25. #执行度,包围盒的信心分数
  26. scores = dets[:, 4]#所有行第五列
  27. keep = []#保留
  28. #按边界框的置信度得分排序 尾部加上[::-1] 倒序的意思 如果没有[::-1] argsort返回的是从小到大的
  29. index = scores.argsort()[::-1]#对所有行的第五列进行从大到小排序,返回索引值
  30. #迭代边界框
  31. while index.size > 0: # 6 > 0, 3 > 0, 2 > 0
  32. i = index[0] # every time the first is the biggst, and add it directly每次第一个是最大的,直接加进去
  33. keep.append(i)#保存
  34. #计算并集上交点的纵坐标(IOU)
  35. x11 = np.maximum(x1[i], x1[index[1:]]) # calculate the points of overlap计算重叠点
  36. y11 = np.maximum(y1[i], y1[index[1:]]) # index[1:] 从下标为1的数开始,直到结束
  37. x22 = np.minimum(x2[i], x2[index[1:]])
  38. y22 = np.minimum(y2[i], y2[index[1:]])
  39. #计算并集上的相交面积
  40. w = np.maximum(0, x22 - x11 + 1) # the weights of overlap重叠权值、宽度
  41. h = np.maximum(0, y22 - y11 + 1) # the height of overlap重叠高度
  42. overlaps = w * h# 重叠部分、交集
  43. #IoU:intersection-over-union的本质是搜索局部极大值,抑制非极大值元素。即两个边界框的交集部分除以它们的并集。
  44. # 重叠部分 / (面积[i] + 面积[索引[1:]] - 重叠部分)
  45. ious = overlaps / (areas[i] + areas[index[1:]] - overlaps)#重叠部分就是交集,iou = 交集 / 并集
  46. print("ious", ious)
  47. # ious <= 0.7
  48. idx = np.where(ious <= thresh)[0]#判断阈值
  49. print("idx", idx)
  50. index = index[idx + 1] # because index start from 1 因为下标从1开始
  51. return keep #返回保存的值
  52. def main():
  53. # 创建数组
  54. boxes = np.array([[100, 100, 210, 210, 0.72],
  55. [250, 250, 420, 420, 0.8],
  56. [220, 220, 320, 330, 0.92],
  57. [100, 100, 210, 210, 0.72],
  58. [230, 240, 325, 330, 0.81],
  59. [220, 230, 315, 340, 0.9]])
  60. show(boxes)
  61. def show(boxes):
  62. plt.figure(1) # 画图窗口、图形
  63. plt.subplot(1, 2, 1) # 子图
  64. plot_bbox(boxes, 'k') # before nms 使用nms(非极大抑制)算法前
  65. plt.subplot(1, 2, 2) # 子图
  66. keep = py_cpu_nms(boxes, thresh=0.7) # nms(非极大抑制)算法
  67. print(keep)
  68. plot_bbox(boxes[keep], 'r') # after nms 使用nms(非极大抑制)算法后
  69. plt.show() # 显示图像
  70. if __name__ == '__main__':
  71. main()

效果图

 

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/weixin_40725706/article/detail/496679
推荐阅读
相关标签
  

闽ICP备14008679号