文本对抗样本攻击与防御技术综述

作者：杜小虎，吴宏明，易子博，李莎莎，马俊，余杰

摘要：对抗样本攻击与防御是最近几年兴起的一个研究热点，攻击者通过微小的修改生成对抗样本来使深度神经网络预测出错。生成的对抗样本可以揭示神经网络的脆弱性，并可以修复这些脆弱的神经网络以提高模型的安全性和鲁棒性。对抗样本的攻击对象可以分为图像和文本两种，大部分研究方法和成果都针对图像领域，由于文本与图像本质上的不同，在攻击和防御方法上存在很多差异。该文对目前主流的文本对抗样本攻击与防御方法做出了较为详尽的介绍，同时说明了数据集、主流攻击的目标神经网络，并比较了不同攻击方法的区别。最后总结文本对抗样本领域面临的挑战，并对未来的研究进行展望。

关键词：自然语言处理；对抗样本；深度神经网络

引用格式：杜小虎,吴宏明,易子博,李莎莎,马俊,余杰. 文本对抗样本攻击与防御技术综述[J].中文信息学报, 2021, 35(8): 1-15.

DU Xiaohu, WU Hongming, YI Zibo, LI Shasha, MA Jun, YU Jie. Adversarial TextAttack and Defense: A Review[J].Journal of Chinese Information Processing,2021,35(8): 1-15.

全文链接：http://jcip.cipsc.org.cn/CN/abstract/abstract3171.shtml

内容中包含的图片若涉及版权问题，请及时与我们联系删除

文本对抗样本攻击与防御技术综述

评论列表

评论