牛津大学出品：随机噪声对抗训练_数据存在噪声时使用对抗学习

作者：IT小白 | 2024-04-04 19:58:54

踩

数据存在噪声时使用对抗学习

引言

该论文出自于牛津大学，主要是关于对抗训练的研究。目前已经有研究表明使用单步 $\mathrm{FGSM}$ 进行对抗训练会导致一种严重的过拟合现象，在该论文中作者经过理论分析和实验验证重新审视了对抗噪声和梯度剪切在单步对抗训练中的作用。作者发现对于大的对抗扰动半径可有效避免过拟合现象。基于该观察结果，作者提出了一种随机噪声对抗训练 $\mathrm{N\text{-}FGSM}$ ，实验表明该方法不仅提供了单步对抗训练的减少计算开销的好处，而且也不会受到过拟合现象的影响。论文里没有提供相关源代码，本文最后一节是关于该论文算法的一个简单实现。
论文链接：https://arxiv.org/abs/2202.01181

预备知识

给定一个参数为 $\theta$ 的分类器 $f_\theta:\mathcal{X}\rightarrow \mathcal{Y}$ ，一个对抗扰动集合 $\mathcal{S}$ 。如果对于任意的对抗扰动 $\delta\in \mathcal{S}$ ，有 $f_\theta(x+\delta)=f_\theta(x)$ ，则可以说 $f_\theta$ 在点 $x\in \mathcal{X}$ 关于对抗扰动集合 $\mathcal{S}$ 是鲁棒的。对抗扰动集合 $\mathcal{S}$ 的定义为 $\mathcal{S}=\{\delta:\|\delta\|_\infty\le \epsilon\}$ 为了使得神经网络模型能够在 $\ell_\infty$ 范数具有鲁棒性。对抗训练在数据集 $\mathcal{D}=\{(x_i,y_i)\}_{i=1:N}$ 上修正类别训练进程并最小化损失函数，其中对抗训练的目标为 $\min\limits_{\theta}\sum\limits_{i=1}^N\max\limits_{\delta} \mathcal{L}(f_\theta(x_i+\delta),y_i)\quad \mathrm{s.t.}\quad \|\delta\|_\infty \le \epsilon$ 其中 $\mathcal{L}$ 是图片分类器的交叉熵损失函数。由于找到内部最大化的最优解是非常困难的，对抗训练最常见的方法就是通过 $\mathrm{PGD}$ 来近似最坏情况下的对抗扰动。虽然这已经被证明可以产生鲁棒性模型，但是计算开销随着 $\mathrm{PGD}$ 迭代数量而线性增加。因此，当前的工作专注于通过一步逼近内部最大化最优解来降低对抗训练的成本。

假设损失函数对于输入的变化是局部线性的，那么可以知道对抗训练内部最大化具有封闭形式的解。 $\mathrm{Goodfellow}$ 利用这一点提出了 $\mathrm{FGSM}$ ，其中对抗扰动遵循梯度符号的方向， $\mathrm{Tramer}$ 等人建议在 $\mathrm{FGSM}$ 之前添加一个随机初始化。然而，这两种方法后来都被证明容易受到多步攻击，具体公式表示为 $\delta=\psi\left(\eta+\alpha \cdot \mathrm{sign}(\nabla_{x_i} \mathcal{L}(f_\theta(x_i+\eta),y_i))\right)$ 其中， $\eta$ 服从概率分布 $\Omega$ 。当 $\psi$ 是投影到 $\ell_\infty$ 操作，并且 $\Omega$ 是均匀分布 $[-\epsilon,\epsilon]^d$ ， $d$ 是输入空间的维数。

$\mathrm{N\text{-}FGSM}$ 对抗训练

在进行对抗性训练时，一种常见的做法是将训练期间使用的干扰限制在 $\epsilon \text{-}\ell_\infty$ 范围。其背后原理是，在训练期间增加扰动的幅度可能不必要地降低分类精度，因为在测试时不会评估约束球外的扰动。虽然通过剪裁或限制噪声大小来限制训练期间使用的扰动是一种常见做法，但是由于梯度剪切是在采取梯度上升步骤后执行的，所以剪切点可能不再进行有效的对抗训练。基于上述动机，作者主要探索梯度剪裁操作和随机步长中噪声的大小在单步方法中获得的鲁棒性的作用。作者本文中提出了一种简单有效的单步对抗训练方法 $\mathrm{N\text{-}FGSM}$ ，具体的计算公式如下所示： $\delta_{\mathrm{N\text{-}FGSM}}=\eta+\alpha \cdot \mathrm{sign}(\nabla_{x_i}\mathcal{L}(f_\theta(x_i+\eta)),y_i)$ 其中 $\eta$ 是从均分布 $k,k]^d$ 中采样得来。由于 $\mathrm{N\text{-}FGSM}$ 不涉及梯度剪裁，可以发它扰动的期望平方范数大于 $\mathrm{RS\text{-}FGSM}$ 。相关算法流程图，引理和定理的证明如下所示。

引理1（对抗扰动的期望）： 已知 $\mathrm{N}\text{-}\mathrm{FGSM}$ 的对抗扰动如下定义： $\delta_{\mathrm{N}\text{-}\mathrm{FGSM}}=\eta + \alpha\cdot \mathrm{sign}(\nabla_x \ell(f(x+\eta),y))$ 其中 $\eta\sim \Omega$ ，分布 $\Omega$ 是均匀分布 $\mathcal{U}\left([-k\epsilon,k\epsilon]^d\right)$ ，并且对抗扰动步长为 $\alpha > 0$ ，则有 $\mathbb{E}[\|\delta_{\mathrm{N\text{-}FGSM}}\|_2^2]=d\left(\frac{k^2\epsilon^2}{3}+\alpha^2\right),\quad \mathbb{E}[\|\delta_{\mathrm{N\text{-}FGSM}}\|_2]\le \sqrt{d\left(\frac{k^2\epsilon^2}{3}+\alpha^2\right)}$

证明： 由 $\mathrm{Jensen}$ 不等式可知，当时函数 $f(x）=\sqrt{x}$ 是凹函数，则有 $\mathbb{E}[f(x)]\le f(\mathbb{E}[x])$ 则以下不等式成立 $\mathbb{E}_\eta[\|\delta_{\mathrm{N-FGSM}}\|_2]\le \sqrt{\mathbb{E}_{\eta}[\|\delta_{\mathrm{N\text{-}FGSM}}\|]}$ 以下主要计算期望 $\mathbb{E}_{\eta}[\|\delta_{\mathrm{N\text{-}FGSM}}\|]$ 并将 $\nabla_x \ell(f(x+\eta),y)_i$ 缩写为 $\nabla(\eta)_i$ ，具体证明步骤如下所示

$\begin{aligned}\mathbb{E}_\eta[\|\delta_{\mathrm{N-FGSM}}\|^2_2]&=\mathbb{E}_\eta\|\eta+\alpha \cdot \mathrm{sign}(\nabla_x\ell(f(x+\eta),y))\|_2^2\\&=\mathbb{E}\left[\sum\limits_{i=1}^d(\eta_i+\alpha \cdot \mathrm{sign}(\nabla(\eta)_i))^2\right]\\&=\sum\limits_{i=1}^d \mathbb{E}_\eta[(\eta_i+\alpha \cdot \mathrm{sign}(\nabla(\eta)_i))^2]\\&=\sum\limits_{i=1}^d\mathbb{E}_\eta[(\eta_i + \alpha \cdot \mathrm{sign}(\nabla(\eta)_i))^2|\mathrm{sign}(\nabla(\eta)_i)=1]\cdot\mathbb{P}_\eta[\mathrm{sign}(\nabla (\eta)_i)=1]\\&+\sum\limits_{i=1}^d\mathbb{E}_\eta[(\eta_i + \alpha \cdot \mathrm{sign}(\nabla(\eta)_i))^2|\mathrm{sign}(\nabla(\eta)_i)=-1]\cdot\mathbb{P}_\eta[\mathrm{sign}(\nabla (\eta)_i)=-1]\\&=\sum\limits_{i=1}^d\frac{1}{2 k \epsilon} \int_{-k \epsilon}^{k\epsilon}(\eta_i+\alpha)^2 d\eta_i\cdot\mathbb{P}_\eta[\mathrm{sign}(\nabla(\eta)_i)=1]+\frac{1}{2 k \epsilon}\sum\limits_{i=1}^d\int_{-k\epsilon}^{k\epsilon}(\eta_i-\alpha)^2d\eta_i \cdot \mathbb{P}_\eta[\mathrm{sign}(\nabla(\eta)_i)=-1]\\&=\sum\limits_{i=1}^d\frac{1}{2 k\epsilon}\int_{\alpha-k\epsilon}^{\alpha+k\epsilon}z^2dz \cdot \mathbb{P}_\eta[\mathrm{sign}(\nabla(\eta)_i)=1]+\sum\limits_{i=1}^d\frac{1}{2 k\epsilon}\int_{-\alpha-k\epsilon}^{-\alpha+k\epsilon}z^2dz \cdot \mathbb{P}_\eta[\mathrm{sign}(\nabla(\eta)_i)=-1]\\&=\sum\limits_{i=1}^d\frac{1}{2 k\epsilon}\int_{\alpha-k\epsilon}^{\alpha+k\epsilon}z^2dz \cdot \mathbb{P}_\eta[\mathrm{sign}(\nabla(\eta)_i)=1]+\sum\limits_{i=1}^d\frac{1}{2 k\epsilon}\int_{\alpha-k\epsilon}^{\alpha+k\epsilon}z^2dz \cdot \mathbb{P}_\eta[\mathrm{sign}(\nabla(\eta)_i)=-1]\\&=\frac{1}{2k\epsilon}\int_{\alpha-k\epsilon}^{\alpha+k \epsilon}z^2 dz\sum\limits_{i=1}^d(\mathbb{P}_\eta[\mathrm{sign}(\nabla(\eta)_i)=1]+\mathbb{P}_\eta[\mathrm{sign}(\nabla (\eta)_i)=-1])\\&=\frac{d}{6 k \epsilon}[(\alpha+k \epsilon)^3-(\alpha-k \epsilon)^3]=\frac{d k^2 \epsilon^2}{3}+ d\alpha^2\end{aligned}$

E_{η} [∥ δ_{N - F G S M} ∥_{2}^{2}] = E_{η} ∥ η + α \cdot s i g n (\nabla_{x} ℓ (f (x + η), y)) ∥_{2}^{2} = E [i = 1 \sum d (η_{i} + α \cdot s i g n (\nabla (η)_{i}))^{2}] = i = 1 \sum d E_{η} [(η_{i} + α \cdot s i g n (\nabla (η)_{i}))^{2}] = i = 1 \sum d E_{η} [(η_{i} + α \cdot s i g n (\nabla (η)_{i}))^{2} ∣ s i g n (\nabla (η)_{i}) = 1] \cdot P_{η} [s i g n (\nabla (η)_{i}) = 1] + i = 1 \sum d E_{η} [(η_{i} + α \cdot s i g n (\nabla (η)_{i}))^{2} ∣ s i g n (\nabla (η)_{i}) = - 1] \cdot P_{η} [s i g n (\nabla (η)_{i}) = - 1] = i = 1 \sum d \frac{1}{2 k ϵ} \int_{- k ϵ}^{k ϵ} (η_{i} + α)^{2} d η_{i} \cdot P_{η} [s i g n (\nabla (η)_{i}) = 1] + \frac{1}{2 k ϵ} i = 1 \sum d \int_{- k ϵ}^{k ϵ} (η_{i} - α)^{2} d η_{i} \cdot P_{η} [s i g n (\nabla (η)_{i}) = - 1] = i = 1 \sum d \frac{1}{2 k ϵ} \int_{α - k ϵ}^{α + k ϵ} z^{2} d z \cdot P_{η} [s i g n (\nabla (η)_{i}) = 1] + i = 1 \sum d \frac{1}{2 k ϵ} \int_{- α - k ϵ}^{- α + k ϵ} z^{2} d z \cdot P_{η} [s i g n (\nabla (η)_{i}) = - 1] = i = 1 \sum d \frac{1}{2 k ϵ} \int_{α - k ϵ}^{α + k ϵ} z^{2} d z \cdot P_{η} [s i g n (\nabla (η)_{i}) = 1] + i = 1 \sum d \frac{1}{2 k ϵ} \int_{α - k ϵ}^{α + k ϵ} z^{2} d z \cdot P_{η} [s i g n (\nabla (η)_{i}) = - 1] = \frac{1}{2 k ϵ} \int_{α - k ϵ}^{α + k ϵ} z^{2} d z i = 1 \sum d (P_{η} [s i g n (\nabla (η)_{i}) = 1] + P_{η} [s i g n (\nabla (η)_{i}) = - 1]) = \frac{d}{6 k ϵ} [(α + k ϵ)^{3} - (α - k ϵ)^{3}] = \frac{d k ^{2} ϵ ^{2}}{3} + d α^{2}

进而则有

\mathbb{E}_\eta[\|\delta_{\mathrm{N\text{-}FGSM}}\|_2]\le\sqrt{d\left(\frac{k^2\epsilon^2}{3}+\alpha^2\right)}

证毕。

定理1： 令 $\delta_{\mathrm{N\text{-}FGSM}}$ 是 $\mathrm{N\text{-}FGSM}$ 方法生成的对抗扰动， $\delta_{\mathrm{FGSM}}$ 是 $\mathrm{FGSM}$ 方法生成的对抗扰动， $\delta_{\mathrm{RS\text{-}FGSM}}$ 是 $\mathrm{RS\text{-}FGSM}$ 方法生成的对抗扰动，对于任意的 $\epsilon>0$ ，则有以下不等式成立 $\mathbb{E}_{\eta}[\|\delta_{\mathrm{N\text{-}FGSM}}\|_2^2]>\mathbb{E}_\eta[\|\delta_{\mathrm{FGSM}}\|^2_2]>\mathbb{E}[\|\delta_{\mathrm{RS\text{-}FGSM}}\|^2_2]$

证明：由引理1可知 $\mathbb{E}_\eta[\|\delta_{\mathrm{N\text{-}FGSM}}\|_2^2]=d\left(\frac{k^2\epsilon^2}{3}+\alpha^2\right)$ 又因为 $\mathbb{E}_\eta[\|\delta_{\mathrm{RS\text{-}FGSM}}\|^2_2]=d\left(-\frac{1}{6}\alpha^3+\frac{1}{2}\alpha^2+\frac{1}{3}\epsilon^2\right)$ $\mathbb{E}_\eta[\|\delta_{\mathrm{FGSM}}\|_2^2]=\|\delta_{\mathrm{FGSM}}\|_2^2=d\epsilon^2$ 如果令超参数 $k = 2$ ， $\alpha=\epsilon$ ， $\alpha=\frac{5\epsilon}{4}$ ，则有 $\mathbb{E}_\eta[\|\delta_{\mathrm{N\text{-}FGSM}}\|_2^2]=\frac{7}{3}d\epsilon^2>\mathbb{E}_\eta[\|\delta_{\mathrm{FGSM}}\|_2^2]=d \epsilon^2 > \mathbb{E}_\eta[\|\delta_{\mathrm{RS-FGSM}}\|_2^2]=\frac{101}{128}d \epsilon^2$ 证毕。

实验结果

下图表示的是在数据集 $\mathrm{CIFAR10}$ （左）和 $\mathrm{SVHN}$ （右）上比较 $\mathrm{N\text{-}FGSM}$ 和 $\mathrm{GradAlign}$ 的多步方法在不同的扰动半径下使用神经网络 $\mathrm{PreactResNet18}$ 的分类准确率。可以发现尽管所有方法都达到干净样本的分类精度（虚线），但 $\mathrm{PGD\text{-}10}$ 和单步法之间在鲁棒精度方面存在差距，而且，最重要的是 $\mathrm{PGD\text{-}10}$ 是 $\mathrm{N\text{-}FGSM}$ 的计算开销的10倍。

下图表示的是在数据在 $\mathrm{CIFAR100}$ （左）和 $\mathrm{SVHN}$ （右）上的单步方法与网络 $\mathrm{PreactResNet18}$ 在不同扰动半径上的比较。可以发现该论文的方法 $\mathrm{N\text{-}FGSM}$ 可以匹配或超过现有技术的结果，同时将计算成本降低3倍。

下图表示的是在训练开始（顶部）和结束（底部）的几个时期，对抗扰动 $\delta$ 和梯度平均值的可视化图。可以发现当过拟合之后， $\mathrm{FGSM}$ 和 $\mathrm{RS\text{-}FGSM}$ 无法对对抗扰动 $\delta$ 进行解释，其梯度也是如此，但是 $\mathrm{N\text{-}FGSM}$ 和 $\mathrm{PGD\text{-}10}$ 却可以避免这种情况的发生。

程序代码

该论文并没有提供源码，以下是在 $\mathrm{mnist}$ 数据集中对论文中代码进行的实现。

import argparse
import logging
import time

import numpy as np
import torch
import torch.nn as nn
import torch.nn.functional as F
import torchvision
from torchvision import datasets, transforms
from torch.utils.data import DataLoader, Dataset
import os
import argparse

def get_args():
    parser = argparse.ArgumentParser()
    parser.add_argument('--batch-size', default=100, type=int)
    parser.add_argument('--data-dir', default='mnist-data', type=str)
    parser.add_argument('--epochs', default=10, type=int)
    parser.add_argument('--epsilon', default=0.3, type=float)
    parser.add_argument('--alpha', default=0.375, type=float)
    parser.add_argument('--lr-max', default=5e-3, type=float)
    parser.add_argument('--lr-type', default='cyclic')
    parser.add_argument('--fname', default='mnist_model', type=str)
    parser.add_argument('--seed', default=0, type=int)
    return parser.parse_args()

class Flatten(nn.Module):
    def forward(self, x):
        return x.view(x.size(0), -1)

def mnist_net():
    model = nn.Sequential(
        nn.Conv2d(1, 16, 4, stride=2, padding=1),
        nn.ReLU(),
        nn.Conv2d(16, 32, 4, stride=2, padding=1),
        nn.ReLU(),
        Flatten(),
        nn.Linear(32*7*7,100),
        nn.ReLU(),
        nn.Linear(100, 10)
    )
    return model

class Attack_methods(object):
    def __init__(self, model, X, Y, epsilon, alpha):
        self.model = model
        self.epsilon = epsilon
        self.X = X
        self.Y = Y
        self.epsilon = epsilon
        self.alpha = alpha

    def nfgsm(self):
        eta = torch.zeros_like(self.X).uniform_(-self.epsilon, self.epsilon)
        delta = torch.zeros_like(self.X)
        eta.requires_grad = True
        output = self.model(self.X + eta)
        loss = nn.CrossEntropyLoss()(output, self.Y)
        loss.backward()
        grad = eta.grad.detach()
        delta.data = eta + self.alpha * torch.sign(grad)
        return delta

class Adversarial_Trainings(object):
    def __init__(self, epochs, train_loader, model, opt, epsilon, alpha, iter_num, lr_max, lr_schedule,
                 fname, logger):
        self.epochs = epochs
        self.train_loader = train_loader
        self.model = model
        self.opt = opt
        self.epsilon = epsilon
        self.alpha = alpha
        self.iter_num = iter_num
        self.lr_max = lr_max
        self.lr_schedule = lr_schedule
        self.fname = fname
        self.logger = logger

    def fast_training(self):
        for epoch in range(self.epochs):
            start_time = time.time()
            train_loss = 0
            train_acc = 0
            train_n = 0

            for i, (X, y) in enumerate(self.train_loader):
                X, y = X.cuda(), y.cuda()
                lr = self.lr_schedule(epoch + (i + 1) / len(self.train_loader))
                self.opt.param_groups[0].update(lr=lr)

                # Generating adversarial example
                adversarial_attack = Attack_methods(self.model, X, y, self.epsilon, self.alpha)
                delta = adversarial_attack.nfgsm()

                # Update network parameters
                output = self.model(torch.clamp(X + delta, 0, 1))
                loss = nn.CrossEntropyLoss()(output, y)
                self.opt.zero_grad()
                loss.backward()
                self.opt.step()

                train_loss += loss.item() * y.size(0)
                train_acc += (output.max(1)[1] == y).sum().item()
                train_n += y.size(0)

            train_time = time.time()
            self.logger.info('%d \t %.1f \t %.4f \t %.4f \t %.4f', epoch, train_time - start_time, lr, train_loss/train_n, train_acc/train_n)
            torch.save(self.model.state_dict(), self.fname)

logger = logging.getLogger(__name__)
logging.basicConfig(
    format='[%(asctime)s] - %(message)s',
    datefmt='%Y/%m/%d %H:%M:%S',
    level=logging.DEBUG)


def main():
    args = get_args()
    logger.info(args)

    np.random.seed(args.seed)
    torch.manual_seed(args.seed)
    torch.cuda.manual_seed(args.seed)

    mnist_train = datasets.MNIST("mnist-data", train=True, download=True, transform=transforms.ToTensor())
    train_loader = torch.utils.data.DataLoader(mnist_train, batch_size=args.batch_size, shuffle=True)

    model = mnist_net().cuda()
    model.train()

    opt = torch.optim.Adam(model.parameters(), lr=args.lr_max)
    if args.lr_type == 'cyclic':
        lr_schedule = lambda t: np.interp([t], [0, args.epochs * 2 // 5, args.epochs], [0, args.lr_max, 0])[0]
    elif args.lr_type == 'flat':
        lr_schedule = lambda t: args.lr_max
    else:
        raise ValueError('Unknown lr_type')

    logger.info('Epoch \t Time \t LR \t \t Train Loss \t Train Acc')

    adversarial_training = Adversarial_Trainings(args.epochs, train_loader, model, opt, args.epsilon, args.alpha, 40,
                                                 args.lr_max, lr_schedule, args.fname, logger)
    adversarial_training.fast_training()


if __name__ == "__main__":
    main()

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149

运行的实验结果如下所示

声明：本文内容由网友自发贡献，不代表【wpsshop博客】立场，版权归原作者所有，本站不承担相应法律责任。如您发现有侵权的内容，请联系我们。转载请注明出处：https://www.wpsshop.cn/w/IT小白/article/detail/360774

牛津大学出品：随机噪声对抗训练_数据存在噪声时使用对抗学习

引言

预备知识

N - F G S M \mathrm{N\text{-}FGSM} N-FGSM对抗训练

实验结果

程序代码

$\mathrm{N\text{-}FGSM}$ 对抗训练