赞
踩
前言:前段时间投稿 + 参与基金撰写 + 过年, 不知不觉一个多月过去了,最近闲下来看了几篇大模型后门攻击的文章。众所周知,后门攻击并不是一个新兴方向(如2017年第一篇CV工作,2019年第一篇NLP工作),但是,自大模型开始兴起之后,针对大模型的后门攻击2023年开始陆续有学者关注,这篇博客中我将简要介绍几篇针对大模型的后门攻击论文,并对这个“半新不旧”的方向做一个简单的梳理。