- 简介在医学图像分割领域,基于CNN和Transformer的模型都得到了广泛的探索。然而,CNN在长距离建模能力方面存在局限性,而Transformer则受到其二次计算复杂度的限制。最近,基于状态空间模型(SSM)的方法已经成为一种有前途的方法,其中Mamba是一个典型例子。它们不仅在建模长距离交互方面表现出色,而且保持了线性计算复杂度。在本文中,我们利用状态空间模型,提出了一种名为Vision Mamba UNet(VM-UNet)的医学图像分割U形结构模型。具体而言,引入了视觉状态空间(VSS)块作为捕捉广泛上下文信息的基础块,并构建了一个不对称的编码器-解码器结构。我们在ISIC17、ISIC18和Synapse数据集上进行了全面的实验,结果表明VM-UNet在医学图像分割任务中表现出了竞争力。据我们所知,这是第一个基于纯SSM模型构建的医学图像分割模型。我们旨在建立一个基准,并为未来开发更高效、更有效的基于SSM的分割系统提供有价值的见解。我们的代码可在https://github.com/JCruan519/VM-UNet中获得。
- 图表
- 解决问题本文旨在解决医学图像分割中长程建模和计算复杂度的问题,提出了基于状态空间模型的U形结构模型——Vision Mamba UNet(VM-UNet)
- 关键思路文章提出了使用状态空间模型进行医学图像分割的方法,引入了视觉状态空间(VSS)块来捕捉广泛的上下文信息,并构建了一个不对称的编码器-解码器结构。
- 其它亮点实验结果表明,VM-UNet在ISIC17、ISIC18和Synapse数据集上表现出竞争力。此外,本文提供了可用于未来更有效的SSM分割系统开发的基准,并提供了开源代码。
- 在医学图像分割领域,已经有许多使用CNN和Transformer的模型被研究。最近,基于状态空间模型的Mamba等模型也开始受到关注。
沙发等你来抢
去评论
评论
沙发等你来抢