当前位置:   article > 正文

MTCNN论文阅读及代码理解_mtcnn发表在哪

mtcnn发表在哪

MTCNN,全称Joint Face Detection and Alignment using
Multi-task Cascaded Convolutional Networks,2016年提出,论文发表在普通sci上(没有自己研究过,由于sphere face 用的这个才找的), 主要研究的是人脸检测(人脸目标框定位和关键点检测),这篇文章提出三段网络分阶段训练。

PNet:

训练数据:WiderFace(人脸检测)+(Lfw+net)(关键点预测),
人脸检测:根据不同IOU生成对应的人图片,比例为negative:positive:part = 3:1:1,将生成的图片降采样为1212大小的图片,送入网络训练,负样本除了标签信息不需要其他信息,真样本信息(IOU>0.65)除了标签信息还需要标注与ground truth的offset(归一化之后的,不是原始坐标点),
关键点检测:同人脸检测,除了基本从边框抠出来的图片得到其landmark信息(归一化之后的,不是原始坐标点),还做了数据增强:左右镜面转换,左右中心点坐标旋转。
2个回归1个分类的结合:人脸非人脸做分类,bbox和landmark做回归分析,用的都是nn.MSE_Loss
网络:网络架构很简单

复现过程中使用的使三层CNN 3
310 3316 3332 替换 5510,33*16

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/盐析白兔/article/detail/391470
推荐阅读
相关标签
  

闽ICP备14008679号