赞
踩
作者在论文中也提到,三个或更多样本的 convex combinations 并不能带来进一步的性能提升。同时,只对相同标签的样本进行插值也不能带来进一步的性能提升
ImageNet-2012
Cifar-10 and Cifar-100
α = 1 \alpha=1 α=1
对于音频数据,作者在频谱图上进行 mixup. 可以看到,mixup 对于规模较大的模型更有效
这里作者在 discriminator 的训练中使用了 mixup (因为也是一个 classifier),generator 还是用自己生成的 data 在 discriminator 中的 loss 来训练。上图为在两个玩具数据集上训练得到的 GAN 网络,其中蓝色点为数据集中的样本
Figure 3, right plot 展示了 feature-level CutMix 的性能 (0=image level, 1=after first conv-bn, 2=after layer1, 3=after layer2, 4=after layer3),结果表明直接在图像上做 CutMix 效果是最好的
SnapMix for Fine-grained Recognition
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。