Magnitude-based Neuron Pruning for Backdoor Defens

简介

深度神经网络（DNN）已知容易受到后门攻击，这对它们的可靠部署构成了令人担忧的威胁。最近的研究表明，通过修剪一组特定的神经元，可以从感染的DNN中清除后门，然而如何有效地识别和删除这些与后门相关的神经元仍然是一个未解决的挑战。在本文中，我们研究了后门行为与神经元大小之间的相关性，并发现后门神经元偏离了模型的大小-显著性相关性。这种偏离启发我们提出了一种基于大小的神经元修剪（MNP）方法来检测和修剪后门神经元。具体而言，MNP使用三个大小引导的目标函数来操作后门神经元的大小-显著性相关性，从而实现揭示后门行为、消除后门神经元和保留干净神经元的目的。实验证明，我们的修剪策略在有限的干净数据量下，对各种后门攻击实现了最先进的后门防御性能，证明了大小在指导后门防御方面的关键作用。
作者讲解

目前尚无作者解读视频，你可点击下方【许愿开讲】按钮，许愿作者开讲~
图表
解决问题

如何有效地识别和消除深度神经网络中的后门攻击？
关键思路

通过研究后门神经元的大小和重要性之间的关系，提出了基于大小的神经元修剪方法（MNP）来检测和消除后门神经元。
其它亮点

实验表明，MNP策略在有限的干净数据量下，对各种后门攻击都能够实现最先进的防御性能。论文提出的思路和方法为解决深度神经网络后门攻击问题提供了新的思路。
相关研究

近期的相关研究包括《Neural Cleanse: Identifying and Mitigating Backdoor Attacks in Neural Networks》和《STRIP: A Defence Against Trojan Attacks on Deep Neural Networks》等。

Magnitude-based Neuron Pruning for Backdoor Defens

提问交流

提问交流