赞
踩
标题 | BBN: Bilateral-Branch Network with Cumulative Learning for Long-Tailed Visual Recognition |
---|---|
会议 | CVPR 2020 |
原文链接 | BBN: Bilateral-Branch Network With Cumulative Learning for Long-Tailed Visual Recognition (thecvf.com) |
代码链接 | Megvii-Nanjing/BBN: The official PyTorch implementation of paper BBN: Bilateral-Branch Network with Cumulative Learning for Long-Tailed Visual Recognition (github.com) |
领域 | 长尾学习 (类别平衡重新采样 Re-sampling 方向) |
性能 | 错误率: 33.71 33.71 33.71 (iNaturalist 2018) , 36.61 36.61 36.61 (iNaturalist 2017) |
上图展示了在两个长尾数据集 CIFAR-100-IR50 和 CIFAR-10-IR50 上,三种不同学习方式的表征学习和分类器学习的最高错误率 (值越小越好)。CE (Cross-Entropy) 、RW (Re-Weighting) 和 RS (Re-Sampling) 是上述提到的三种不同的学习方法。横轴是表征学习;纵轴是分类器学习。
第 1 阶段 -【表征学习】
第 2 阶段 -【分类器学习】
双边分支网络 (BBN) 的模型框架如下图所示:
数据集 | Long-tailed CIFAR-10 和 CIFAR-100 | iNaturalist2017 和 iNaturalist 2018 |
---|---|---|
Back-bone | ResNet-32 | ResNet-50 |
Optimizer | SGD | - |
初始学习率 | 0.1 0.1 0.1 | - |
权重衰减 | 2 × 1 0 − 4 2×10^{-4} 2×10−4 | - |
Momentum | 0.9 0.9 0.9 | - |
显卡要求 | GTX1080Ti × 1 × 1 ×1 | GTX1080Ti × 4 × 4 ×4 |
Epoch | 200 | - |
Batch Size | 128 | 128 |
作者对三种不同不平衡率 (imbalance ratios, β = N m a x N m i n \beta=\cfrac{N_{max}}{N_{min}} β=NminNmax) 的 Long-tailed CIFAR 数据集进行了实验,分别是 β = 10 , 50 和 100 \beta=10,50 和100 β=10,50和100 .
下表展示了各种方法的错误率 (Error Rate,越低越好) :
上表证明,在参与比较的所有方法中, BBN 模型在所有 Long-tailed CIFAR 数据集上都取得了最好的结果。
对比的方法包括两阶段微调策略 (即 CE-DRW 和 CE-DRS) 、一系列的 mixup 算法 (即 mixup、manifold mixup 和带有与 BBN 相同的两个采样器的 manifold mixup) 、以及先前的最先进方法 (即 CB-Focal 和 LDAM-DRW ) 。
特别是在 Imbalance ratios =100 (即极度不平衡的情况) 的 Long-tailed CIFAR-10 数据集上,BBN 得到了 20.18 20.18 20.18 的错误率,比 LDAM-DRW 还要低 2.79% 。此外,上表中还可以发现:两阶段微调策略 (即 CE-DRW 和 CE-DRS) 是有效的,因为它们与最先进的方法相比,可以获得相似甚至更好的结果。
两个大规模长尾数据集 iNaturalist 2018 和 iNaturalist 2017 的实验结果如下表所示:
“*” 号表示 LDAM-DRW 原文中的实验结果, 不带则表示 BBN 作者自己用 LDAM-DRW 源代码跑的结果,并表示复现不出原文的实验结果。
此外,由于 iNaturalist 数据集是大规模的,作者还额外用 2 × 2× 2× scheduler 进行网络训练。同时,为了保证公平,作者还对 LDAM-DRW 使用 2 × 2× 2× scheduler 进行网络训练。结果表明:在采用 2 × 2× 2× scheduler 的情况下,BBN 比没有采用 2 × 2× 2× scheduler 的 BBN 取得了更好的结果。此外,与 LDAM-DRW ( 2 × 2× 2× ) 相比,BBN 在 iNaturalist 2018 和 iNaturalist 2017 上分别取得了 3.50 3.50 3.50% 和 3.94 3.94 3.94% 的提升。
此外,即时是不使用 2 × 2× 2× scheduler 的 BBN 仍然是取得最好的结果 (忽略 LDAM-DRW 原文中的实验结果的情况下) 。
BBN 提出的这个会随着训练 Epoch 增大而不断变小的自适应权衡参数 α \alpha α 真是非常巧妙地实现了:先在训练前期采纳 【常规学习分支】的预测结果,再在训练后期采纳【再平衡分支】的预测结果。从而完美兼顾了表征学习和分类器学习。既能提高分类器在尾部数据的性能表现,又能避免再平衡方法破坏整体特征的表达能力。一箭双雕,妙哉妙哉~
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。