赞
踩
MTCNN,全称Joint Face Detection and Alignment using
Multi-task Cascaded Convolutional Networks,2016年提出,论文发表在普通sci上(没有自己研究过,由于sphere face 用的这个才找的), 主要研究的是人脸检测(人脸目标框定位和关键点检测),这篇文章提出三段网络分阶段训练。
训练数据:WiderFace(人脸检测)+(Lfw+net)(关键点预测),
人脸检测:根据不同IOU生成对应的人图片,比例为negative:positive:part = 3:1:1,将生成的图片降采样为1212大小的图片,送入网络训练,负样本除了标签信息不需要其他信息,真样本信息(IOU>0.65)除了标签信息还需要标注与ground truth的offset(归一化之后的,不是原始坐标点),
关键点检测:同人脸检测,除了基本从边框抠出来的图片得到其landmark信息(归一化之后的,不是原始坐标点),还做了数据增强:左右镜面转换,左右中心点坐标旋转。
2个回归1个分类的结合:人脸非人脸做分类,bbox和landmark做回归分析,用的都是nn.MSE_Loss
网络:网络架构很简单
复现过程中使用的使三层CNN 3310 3316 3332 替换 5510,33*16
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。