- 简介现有的基于Transformer的点云分析模型存在二次复杂度问题,导致点云分辨率降低和信息丢失。相比之下,新提出的基于状态空间模型(SSM)的Mamba模型仅具有线性复杂度,且在多个方面表现优于Transformer。然而,直接采用Mamba模型在点云任务上无法达到令人满意的性能。本文提出了Mamba3D,一种专为点云学习量身定制的状态空间模型,以增强局部特征提取,实现卓越性能、高效率和可扩展潜力。具体而言,我们提出了一种简单而有效的局部标准池(LNP)块来提取局部几何特征。此外,为了获得更好的全局特征,我们引入了一个双向SSM(bi-SSM),包括一个令牌正向SSM和一个在特征通道上操作的新颖的反向SSM。广泛的实验结果表明,Mamba3D在多个任务中均优于基于Transformer的对手和并行工作,无论是否进行预训练。值得注意的是,Mamba3D实现了多个SoTA,包括在ScanObjectNN上从头开始的92.6%的总体准确率和在ModelNet40分类任务上进行单模态预训练的95.1%的准确率,仅具有线性复杂度。
-
- 图表
- 解决问题本论文旨在解决点云分析中现有的基于Transformer的模型复杂度高、分辨率低、信息丢失等问题,提出了一种基于状态空间模型(SSM)的Mamba模型,并进一步提出了针对点云学习的Mamba3D模型,以增强局部特征提取和全局特征提取能力。
- 关键思路Mamba3D模型是一种基于状态空间模型的点云学习模型,通过引入局部规范池化(LNP)块和双向SSM(bi-SSM)来提取局部和全局特征,从而实现了高效、可扩展的点云分析。
- 其它亮点Mamba3D模型在多个任务上表现出超越Transformer的性能,包括ScanObjectNN和ModelNet40分类任务。此外,实验结果还表明,Mamba3D模型可以在不进行预训练的情况下获得92.6%的准确率,而进行单模态预训练后可以获得95.1%的准确率。该论文的代码已经开源,并且值得进一步研究。
- 最近在点云分析领域的相关研究包括:PointNet、PointNet++、DGCNN等。
NEW
提问交流
提交问题,平台邀请作者,轻松获得权威解答~
向作者提问

提问交流