S-E Pipeline: A Vision Transformer (ViT) based Resilient Classification Pipeline for Medical Imaging Against Adversarial Attacks

Neha A S ,
Vivek Chaturvedi ,
Muhammad Shafique
2024年07月23日
  • 简介
    Vision Transformer(ViT)因其强大的自注意机制,在医学影像中自动进行准确的疾病诊断方面变得越来越流行。然而,ViT仍然容易受到对抗性攻击的影响,这可能会通过导致关键疾病的故意错误分类来阻碍诊断过程。在本文中,我们提出了一种新的图像分类流程,即S-E Pipeline,它执行多个预处理步骤,使ViT能够训练关键特征,从而减少对抗者输入扰动的影响。我们的方法使用分割和图像增强技术的组合,例如对比度有限自适应直方图均衡化(CLAHE)、锐化掩蔽(UM)和高频强调滤波(HFE)作为预处理步骤,以识别关键特征,即使在对抗性扰动之后也能保持完整。实验研究表明,我们的新型流程有助于减少对抗性攻击的影响,对于ViT-b32模型和ViT-l32模型分别减少了72.22%和86.58%。此外,我们展示了我们提出的方法在NVIDIA Jetson Orin Nano板上的端到端部署,以展示它在通常受资源限制的现代手持设备中的实际用例。
  • 图表
  • 解决问题
    本文旨在解决Vision Transformer(ViT)在医学影像中应用时容易受到对抗攻击的问题,导致诊断错误的情况。
  • 关键思路
    提出了一种名为S-E Pipeline的图像分类流程,通过多个预处理步骤来识别关键特征,从而减少对抗攻击的影响。这些预处理步骤包括分割和图像增强技术,如CLAHE、UM和HFE。
  • 其它亮点
    实验结果表明,S-E Pipeline可以减少对ViT-b32和ViT-l32模型的对抗攻击影响分别达到72.22%和86.58%。此外,论文还在NVIDIA Jetson Orin Nano板上展示了该方法的端到端部署,证明其在资源受限的现代手持设备中具有实际应用。
  • 相关研究
    最近的相关研究包括:1. Adversarial Defense by Restricting the Hidden Space of Deep Neural Networks;2. Adversarial Defense via the Maximum Softmax Probability Criterion;3. Improving Adversarial Robustness via Guided Complement Entropy
PDF
原文
点赞 收藏 评论 分享到Link

沙发等你来抢

去评论