赞
踩
智能化的对健身动作进行识别、矫正、计数
2. 打架识别
3. 来客分析
通过对来店客人的属性识别、行为预警、时长和轨迹记录等数据进行统计分析, 可以应用于 相关场所的客流通统计、用户画像、客户留存分析等功能, 进而提升 相关场所的经营和服务水平
4. 车辆结构化识别
车牌识别、车辆属性分析、违章检测、车流量计数
论文地址:PP-YOLOE+
主要创新点:
YOLOV5 | YOLOX | PPYOLOE | YOLOV6 | |
数据增广 | mosaic、mixup等 | mosaic、mixup等 | 只有最基本的 | 同yolov5 |
backbone | cspdarknet | cspdarknet | CSPRepResNet | EfficientRep |
neck | PAN | PAN | PAN | Rep-PAN |
Head | 耦合 | 解耦 | ET-Head | 解耦+加速 |
label assignment | max-iou-assign | simOTA | TAL | simOTA |
Anchor-free | anchor-based | Anchor-free | Anchor-free | Anchor-free |
网络结构:
消融实验各改进部分效果
Anchor引入的缺点:
(1) 检测器的性能一般和anchor(框)的比例和尺寸有关。
(2) 一般anchor的尺寸和大小固定,很难处理形状变化大的目标,当进行迁移学习时,可能需要重新设计anchor。
(3) anchor的引入使得训练任务非常繁琐。
(4) 为了得到较高的召回率,通常需要在图片中生成非常密集的anchor,而大部分anchor为负样本,导致正负样本极度不均匀,负样本对检测器没有任何作用。
Anchor-free的引入:
针对预测点,直接预测这个点相对于目标的左侧、上侧、右侧、下侧的距离(l、t、r、b)
xmin = Cx-l*s ymin = Cy-t*s
xmax = Cx+r*s ymax = Cy+b*s
其中,l、t、r、b为回归任务预测得到的,且在特征图尺度上的,需乘s映射到原图。s为预测的特征特相对于原图的步距,(xmin,ymin),(xmax,ymin),(xmax,ymax),(xmin,ymax)分别为顶点坐标。
在backbone部分集成了残差结构和密集连接结构,且推理过程较训练过程少了1x1的残差连接,最后以ESE(注意力模块)连接。
PAN(Path Aggregation Network)结构其实就是在FPN(从顶到底信息融合)的基础上加上了从底到顶的信息融合。
结构:
损失函数:
详细参考:
TAL是由论文TOOD提出,目的是把两个任务的最优anchor拉近,通过设计一个样本分配策略和一个任务对齐的损失来执行。样本分配通过计算每个anchors的任务对齐程度来收集训练样本(即正样本或负样本),而任务对齐损失可以逐步将分类和定位最佳的anchor统一起来,以在训练期间预测分类和定位。因此,在推理时,可以保留具有最高分类分数并共同具有最精确定位的边界框。
anchor对齐度量
通过分类得分和预测框和gt的IoU的高阶组合来表示这个度量:
其中 s 和 u 分别表示分类 Score 和 IoU 值。 α 和 β 用于控制2个任务在anchor对齐度量中的影响。 值得注意的是,t 在2个任务的联合优化中起着关键作用,以实现任务对齐的目标。 它鼓励网络从联合优化的角度动态关注高质量(即任务对齐)Anchor。
训练样本分配
对于每个gt,选择m个具有最大t值的anchor作为正样本点,其余的为负样本。
任务对齐损失
为了显式的增加对齐的anchor的得分,减少不对齐的anchor的得分,用t来代替正样本anchor的标签。
同时,借鉴了focal loss的思想,最后的损失函数如下
其中 j 表示 Nneg 个负anchors中的第 j 个anchors,γ 是focus参数。
定位损失函数和分类类似,使用归一化的t来对GIoU loss进行了加权:
总的loss就是把这两个损失加起来。
赞
踩
赞
踩
赞
踩
赞
踩
赞
踩
赞
踩
赞
踩
赞
踩
赞
踩
赞
踩
赞
踩
赞
踩
赞
踩
赞
踩
赞
踩
赞
踩
赞
踩
赞
踩
赞
踩
赞
踩
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。