ESP-MedSAM: Efficient Self-Prompting SAM for Universal Domain-Generalized Medical Image Segmentation

2024年07月19日
  • 简介
    Segment Anything Model(SAM)已经证明在医学图像分割方面具有出色的适应性,但仍面临三个主要挑战。首先,SAM的巨大计算成本限制了其在实际应用中的适用性。其次,SAM依赖于手动注释(例如点、框),这在临床场景下是费力且不切实际的。第三,SAM平等地处理所有分割目标,这对于具有固有异质性的多样化医学模态是次优的。为了解决这些问题,我们提出了一种用于通用医学图像分割的高效自我提示SAM,称为ESP-MedSAM。我们设计了一种多模态解耦知识蒸馏(MMDKD)策略,从基础模型中提取公共图像知识和特定领域的医学知识,以训练轻量级图像编码器和模态控制器。此外,它们与额外引入的自举补丁提示生成器(SPPG)和查询解耦模态解码器(QDMD)相结合,构成了ESP-MedSAM。具体而言,SPPG旨在自动生成一组补丁提示,而QDMD利用一对一策略为每个模态提供独立的解码通道。大量实验表明,ESP-MedSAM在各种医学图像分割任务中优于现有技术,具有卓越的零-shot学习和模态转移能力。特别是,与SAM-Base相比,我们的框架仅使用31.4%的参数。
  • 图表
  • 解决问题
    本论文旨在解决Segment Anything Model(SAM)在医学图像分割中存在的三个主要挑战:计算成本高、需要手动注释、不能处理不同的分割目标的问题。
  • 关键思路
    论文提出了一种名为ESP-MedSAM的通用医学图像分割方法,采用多模态解耦知识蒸馏(MMDKD)策略来训练轻量级图像编码器和模态控制器,结合自动化的自补丁提示生成器(SPPG)和查询解耦模态解码器(QDMD),以解决SAM的问题。
  • 其它亮点
    论文的亮点包括使用MMDKD策略来训练轻量级图像编码器和模态控制器,引入SPPG和QDMD来构建ESP-MedSAM,实现了优异的零样本学习和模态转移能力,仅使用了SAM-Base的31.4%的参数。实验结果表明,ESP-MedSAM在各种医学图像分割任务中表现优异。
  • 相关研究
    与该论文相关的研究包括医学图像分割中使用的其他深度学习方法,如U-Net和SegNet等。
PDF
原文
点赞 收藏 评论 分享到Link

沙发等你来抢

去评论