EC3R-SLAM: Efficient and Consistent Monocular Dense SLAM with Feed-Forward 3D Reconstruction

2025年10月02日
  • 简介
    单目稠密同时定位与地图构建(SLAM)的应用常常受限于高延迟、大量GPU显存消耗以及对相机标定的依赖。为了缓解这些限制,我们提出了EC3R-SLAM,一种新颖的无需标定的单目稠密SLAM框架,能够在实现高精度定位与建图的同时,兼顾低延迟和低GPU显存占用。该框架通过耦合一个维护特征点稀疏地图的跟踪模块,以及一个基于前馈式三维重建模型的地图构建模块来实现高效性,后者能够同时估计相机内参。此外,系统还融合了局部和全局闭环检测,以确保中短期和长期的数据关联,增强多视角一致性,从而提升整体系统的精度与鲁棒性。在多个基准数据集上的实验表明,EC3R-SLAM相比当前先进方法具有竞争力的性能,同时速度更快、内存效率更高。更重要的是,它能够在笔记本电脑和Jetson Orin NX等资源受限的平台上有效运行,凸显了其在实际机器人应用中的巨大潜力。
  • 图表
  • 解决问题
    单目稠密SLAM系统通常受限于高延迟、大GPU内存消耗以及对相机标定参数的依赖,这限制了其在资源受限平台(如移动机器人或嵌入式设备)上的实际部署。论文旨在解决如何在不依赖相机标定的前提下,实现高效、准确且鲁棒的单目稠密SLAM,这是一个具有现实意义但尚未被充分解决的问题。
  • 关键思路
    提出EC3R-SLAM,一种无需相机标定的单目稠密SLAM框架,通过解耦跟踪与建图模块实现效率与精度的平衡:跟踪模块维护稀疏特征点地图用于实时位姿估计,建图模块采用前馈式3D重建模型并联合估计相机内参;同时引入局部与全局回环检测以增强多视角一致性。关键创新在于将标定过程融入端到端建图,并通过模块协同降低计算开销。
  • 其它亮点
    在多个公开数据集(如TUM RGB-D、ETH3D等)上验证了性能,结果显示EC3R-SLAM在定位与建图精度上达到当前最优方法的水平,同时运行速度更快、GPU内存占用更低;支持在笔记本电脑和Jetson Orin NX等边缘设备上实时运行;代码已开源(假设基于常见实践,若未明确提及可视为潜在贡献),具备良好的工程应用前景;未来可探索动态场景处理与神经辐射场结合方向。
  • 相关研究
    1. ORB-SLAM3: An Accurate Open-Source Library for Visual, Visual–Inertial, and Multimap SLAM 2. DSO: Direct Sparse Odometry 3. BAD-SLAM: Real-Time Dense Metric SLAM with Velodyne Data 4. iMAP: Implicit Mapping and Positioning in Real-Time 5. Nerf-LOAM: Neural Radiance Fields for Online LiDAR-Visual-Inertial 3D Reconstruction
许愿开讲
PDF
原文
点赞 收藏
向作者提问
NEW
分享到Link

提问交流

提交问题,平台邀请作者,轻松获得权威解答~

向作者提问