赞
踩
三个贡献:
后门攻击方法可以分为两类:
根据训练程序中的防御阶段不同,后门防御方法可以分为三类:
相关的benchmarks:
总体架构如下:
构建了一个可以扩展的基于模块的代码块,包括四个模块:输入、攻击、防御、评估分析
为了公平地衡量每个模型的攻击和防御方法的性能影响,没有加任何trick
第一个和第三个图的点都接近反对角线( ASR + R-Acc = 1 ),而第二个图和第四个图都离该线较远(降低的 ASR 大于增加的 R-Acc)。作者认为这与数据集的分类的数量高度相关,因为对于大量的类,防御后更难恢复正确的预测。
作者对出现这些情况的原因分别进行了分析,并总结出了一个有趣的观点:较高中毒率的攻击并不意味着具有更好的攻击性能,并且可能更容易通过一些防御方法进行防御,因为较高的中毒率会突出中毒样本和干净样本之间的差异。
原文链接:https://arxiv.org/pdf/2206.12654.pdf
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。