- 简介医学图像分类是计算机视觉领域中非常基础和关键的任务。近年来,基于CNN和Transformer的模型已被广泛用于分类各种医学图像。不幸的是,CNN在长程建模能力方面的限制阻碍了它们有效地提取医学图像特征,而Transformer则受到其二次计算复杂度的限制。最近的研究表明,由Mamba表示的状态空间模型(SSM)可以有效地建模长程交互,同时保持线性计算复杂度。受此启发,我们提出了专门用于医学图像分类的Vision Mamba(MedMamba)。更具体地说,我们引入了一个新颖的Conv-SSM模块。Conv-SSM将卷积层的局部特征提取能力与SSM捕捉长程依赖关系的能力相结合,从而对不同模态的医学图像进行建模。为了展示MedMamba的潜力,我们使用14个公开可用的医学数据集和两个自建私有数据集进行了广泛的实验。广泛的实验结果表明,所提出的MedMamba在检测各种医学图像中的病变方面表现良好。据我们所知,这是第一个专门针对医学图像分类的Vision Mamba。本研究旨在为医学图像分类任务建立一个新的基准,并为未来更高效、更有效的基于SSM的人工智能算法和应用系统的发展提供有价值的见解。源代码已经可在https://github.com/YubiaoYue/MedMamba获取。
- 图表
- 解决问题本论文旨在解决医学图像分类中长程建模和计算复杂度的问题。研究者提出了一种新的方法MedMamba来处理医学图像分类任务。
- 关键思路论文提出了一种新的Conv-SSM模块,将卷积层的局部特征提取能力与SSM的长程依赖捕捉能力相结合,以实现对不同模态的医学图像进行建模。这种方法在保持线性计算复杂度的同时,有效地提取医学图像特征。
- 其它亮点论文使用14个公共数据集和2个私有数据集进行了广泛的实验,证明了MedMamba在不同医学图像中检测病变方面的良好表现。此外,作者还提供了开源代码。
- 在这个领域中,最近的相关研究包括使用CNN和Transformer的医学图像分类方法。
沙发等你来抢
去评论
评论
沙发等你来抢