Mamba3D: Enhancing Local Features for 3D Point Cloud Analysis via State Space Model

向作者提问

NEW

简介

现有的基于Transformer的点云分析模型存在二次复杂度问题，导致点云分辨率降低和信息丢失。相比之下，新提出的基于状态空间模型（SSM）的Mamba模型仅具有线性复杂度，且在多个方面表现优于Transformer。然而，直接采用Mamba模型在点云任务上无法达到令人满意的性能。本文提出了Mamba3D，一种专为点云学习量身定制的状态空间模型，以增强局部特征提取，实现卓越性能、高效率和可扩展潜力。具体而言，我们提出了一种简单而有效的局部标准池（LNP）块来提取局部几何特征。此外，为了获得更好的全局特征，我们引入了一个双向SSM（bi-SSM），包括一个令牌正向SSM和一个在特征通道上操作的新颖的反向SSM。广泛的实验结果表明，Mamba3D在多个任务中均优于基于Transformer的对手和并行工作，无论是否进行预训练。值得注意的是，Mamba3D实现了多个SoTA，包括在ScanObjectNN上从头开始的92.6％的总体准确率和在ModelNet40分类任务上进行单模态预训练的95.1％的准确率，仅具有线性复杂度。
作者讲解

目前尚无作者解读视频，你可点击下方【许愿开讲】按钮，许愿作者开讲~
图表
解决问题

本论文旨在解决点云分析中现有的基于Transformer的模型复杂度高、分辨率低、信息丢失等问题，提出了一种基于状态空间模型（SSM）的Mamba模型，并进一步提出了针对点云学习的Mamba3D模型，以增强局部特征提取和全局特征提取能力。
关键思路

Mamba3D模型是一种基于状态空间模型的点云学习模型，通过引入局部规范池化（LNP）块和双向SSM（bi-SSM）来提取局部和全局特征，从而实现了高效、可扩展的点云分析。
其它亮点

Mamba3D模型在多个任务上表现出超越Transformer的性能，包括ScanObjectNN和ModelNet40分类任务。此外，实验结果还表明，Mamba3D模型可以在不进行预训练的情况下获得92.6%的准确率，而进行单模态预训练后可以获得95.1%的准确率。该论文的代码已经开源，并且值得进一步研究。
相关研究

最近在点云分析领域的相关研究包括：PointNet、PointNet++、DGCNN等。

许愿开讲

PDF

原文

点赞收藏

向作者提问

NEW

分享到Link

提问交流

提交问题，平台邀请作者，轻松获得权威解答～

向作者提问