- 简介Vision Transformer(ViT)因其强大的自注意机制,在医学影像中自动进行准确的疾病诊断方面变得越来越流行。然而,ViT仍然容易受到对抗性攻击的影响,这可能会通过导致关键疾病的故意错误分类来阻碍诊断过程。在本文中,我们提出了一种新的图像分类流程,即S-E Pipeline,它执行多个预处理步骤,使ViT能够训练关键特征,从而减少对抗者输入扰动的影响。我们的方法使用分割和图像增强技术的组合,例如对比度有限自适应直方图均衡化(CLAHE)、锐化掩蔽(UM)和高频强调滤波(HFE)作为预处理步骤,以识别关键特征,即使在对抗性扰动之后也能保持完整。实验研究表明,我们的新型流程有助于减少对抗性攻击的影响,对于ViT-b32模型和ViT-l32模型分别减少了72.22%和86.58%。此外,我们展示了我们提出的方法在NVIDIA Jetson Orin Nano板上的端到端部署,以展示它在通常受资源限制的现代手持设备中的实际用例。
- 图表
- 解决问题本文旨在解决Vision Transformer(ViT)在医学影像中应用时容易受到对抗攻击的问题,导致诊断错误的情况。
- 关键思路提出了一种名为S-E Pipeline的图像分类流程,通过多个预处理步骤来识别关键特征,从而减少对抗攻击的影响。这些预处理步骤包括分割和图像增强技术,如CLAHE、UM和HFE。
- 其它亮点实验结果表明,S-E Pipeline可以减少对ViT-b32和ViT-l32模型的对抗攻击影响分别达到72.22%和86.58%。此外,论文还在NVIDIA Jetson Orin Nano板上展示了该方法的端到端部署,证明其在资源受限的现代手持设备中具有实际应用。
- 最近的相关研究包括:1. Adversarial Defense by Restricting the Hidden Space of Deep Neural Networks;2. Adversarial Defense via the Maximum Softmax Probability Criterion;3. Improving Adversarial Robustness via Guided Complement Entropy
沙发等你来抢
去评论
评论
沙发等你来抢