S-E Pipeline: A Vision Transformer (ViT) based Resilient Classification Pipeline for Medical Imaging Against Adversarial Attacks

简介

Vision Transformer（ViT）因其强大的自注意机制，在医学影像中自动进行准确的疾病诊断方面变得越来越流行。然而，ViT仍然容易受到对抗性攻击的影响，这可能会通过导致关键疾病的故意错误分类来阻碍诊断过程。在本文中，我们提出了一种新的图像分类流程，即S-E Pipeline，它执行多个预处理步骤，使ViT能够训练关键特征，从而减少对抗者输入扰动的影响。我们的方法使用分割和图像增强技术的组合，例如对比度有限自适应直方图均衡化（CLAHE）、锐化掩蔽（UM）和高频强调滤波（HFE）作为预处理步骤，以识别关键特征，即使在对抗性扰动之后也能保持完整。实验研究表明，我们的新型流程有助于减少对抗性攻击的影响，对于ViT-b32模型和ViT-l32模型分别减少了72.22%和86.58%。此外，我们展示了我们提出的方法在NVIDIA Jetson Orin Nano板上的端到端部署，以展示它在通常受资源限制的现代手持设备中的实际用例。
作者讲解

目前尚无作者解读视频，你可点击下方【许愿开讲】按钮，许愿作者开讲~
图表
解决问题

本文旨在解决Vision Transformer（ViT）在医学影像中应用时容易受到对抗攻击的问题，导致诊断错误的情况。
关键思路

提出了一种名为S-E Pipeline的图像分类流程，通过多个预处理步骤来识别关键特征，从而减少对抗攻击的影响。这些预处理步骤包括分割和图像增强技术，如CLAHE、UM和HFE。
其它亮点

实验结果表明，S-E Pipeline可以减少对ViT-b32和ViT-l32模型的对抗攻击影响分别达到72.22%和86.58%。此外，论文还在NVIDIA Jetson Orin Nano板上展示了该方法的端到端部署，证明其在资源受限的现代手持设备中具有实际应用。
相关研究

最近的相关研究包括：1. Adversarial Defense by Restricting the Hidden Space of Deep Neural Networks；2. Adversarial Defense via the Maximum Softmax Probability Criterion；3. Improving Adversarial Robustness via Guided Complement Entropy

S-E Pipeline: A Vision Transformer (ViT) based Resilient Classification Pipeline for Medical Imaging Against Adversarial Attacks

提问交流

提问交流