当前位置:   article > 正文

深度学习算法二:人脸检测与识别(mtcnn+facenet)思路理解小记录_mtcnn facenet fastapi

mtcnn facenet fastapi

一、人脸检测流程(mtcnn)

1、首先整个模型一共是有三个网络,按顺序依次是P-net,R-net,O-net

2、在传入P-net之前,我们会对图片进行预处理,主要是将一张图片转换成多个尺寸,然后将多个尺寸都传入到P-net中,这样可以适应不同大小的人脸检测

3、P-net将一张图片分成了h/2*w/2个网格,输出有两部分,会被放入同一个列表中:[(1,h/2,w/2,2),(1,h/2,w/2,4)],前一个是h/2*w/2(不是人脸的概率,是人脸的概率)这样的,第二部分是h/2*w/2个框的左上角和右下角两个位置的偏移量,每个点有(dx,dy)两个偏移量,所以两个点一共四个值,也即(dx1,dy1,dx2,dy2)

4、P-net出来之后,会再经过一个后处理模块,主要作用是:根据设置的阈值筛选掉一些框,然后根据网格在(h/2*w/2)个网格中的位置以及预测的偏移量,由一个公式计算出在原图中的实际位置;还会根据之前预测的是人脸的概率得出score,这样最后的输出就是(n_p,x1,y1,x2,y2,score),这里的n代表框的个数,是小于h/2*w/2的,因为后处理是设置了阈值,会去掉一部分框

5、同理,我们按照P-net<

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/Cpp五条/article/detail/325353
推荐阅读
相关标签
  

闽ICP备14008679号