MedMamba: Vision Mamba for Medical Image Classification

2024年03月06日
  • 简介
    医学图像分类是计算机视觉领域中非常基础和关键的任务。近年来,基于CNN和Transformer的模型已经广泛应用于分类各种医学图像。不幸的是,CNN在长程建模能力方面的限制阻碍了它们在医学图像中有效提取特征,而Transformer则受到其二次计算复杂度的阻碍。最近的研究表明,Mamba表示的状态空间模型(SSM)可以有效地建模长程交互并保持线性计算复杂度。受此启发,我们提出了针对医学图像分类的Vision Mamba(MedMamba)。更具体地说,我们引入了一种新颖的Conv-SSM模块。Conv-SSM结合了卷积层的局部特征提取能力和SSM捕捉长程依赖性的能力,从而对不同模态的医学图像进行建模。为了展示MedMamba的潜力,我们使用14个公开可用的医学数据集和两个自己构建的私有数据集进行了大量实验。广泛的实验结果表明,所提出的MedMamba在检测各种医学图像中的病变方面表现良好。据我们所知,这是第一个专门针对医学图像分类的Vision Mamba。本研究的目的是为医学图像分类任务建立一个新的基准,并为未来更高效、更有效的基于SSM的人工智能算法和应用系统的发展提供有价值的见解。源代码已经在https://github.com/YubiaoYue/MedMamba上可用。
  • 图表
  • 解决问题
    本论文旨在解决医学图像分类中长程建模和计算复杂度的问题,提出了一种基于状态空间模型(SSM)的Conv-SSM模块,用于医学图像分类。
  • 关键思路
    论文提出了一种基于Conv-SSM模块的Vision Mamba,将卷积层的局部特征提取能力和SSM的长程依赖建模能力相结合,用于医学图像分类。相比于现有的CNN和Transformer模型,该模型具有更好的性能和更低的计算复杂度。
  • 其它亮点
    论文在14个公开数据集和2个私有数据集上进行了广泛的实验,证明了MedMamba在各种医学图像中检测病变的性能。此外,论文提供了开源代码,为未来更高效、更有效的基于SSM的人工智能算法和应用系统的开发提供了有价值的启示。
  • 相关研究
    近期的相关研究包括基于CNN和Transformer的医学图像分类模型,以及基于SSM的其他应用。其中,一些相关论文包括:“Multi-Scale 3D CNN with Attention for Alzheimer's Disease Diagnosis Using Structural MR Images”、“3D Transformer: Learning Spatial Dependencies from 3D Data with Self-Attention”等。
PDF
原文
点赞 收藏 评论 分享到Link

沙发等你来抢

去评论