赞
踩
最近看了一些字符级别的文本攻击方法,目前字符级别的攻击主要就是两步:找到要攻击的地方(被攻击单词)和如何攻击,针对于这两个不同角度也有一些不一样的文章。
如何找到攻击位置
白盒攻击中可以根据损失函数或者是前向导数等内部参数,反向寻找到输入中对输出影响最大的部分,黑盒攻击中一般都会构造一个打分函数,对文本中的每一个位置进行一个打分,分数越高则说明该部分在当前句子下最重要。
DeepWordBug:Black-box Generation of Adversarial Text Sequences to Evade Deep Learning Classifiers
这是一篇黑盒攻击的文章,着眼于利用打分函数如何寻找到一条文本中最重要的部分,在构造打分函数时充分考虑一个单词对句子前后的影响。
还有一种常用的打分函数,是直接将单词xi变为等长度的空格,分别通过分类器,以此判别单词xi的重要程度。
FastWordBug:A Fast Method To Generate Adversarial Text Against NLP Applications
这篇文章是基于DeepWordBug改进的文章,亮点在于速度快,并且从另外一个视角,将pos技术结合起来,快速构造对抗样本。
第一步:对一段文本中的句子进行重要性排序(
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。