Sparse Color-Code Net: Real-Time RGB-Based 6D Object Pose Estimation on Edge Devices

2024年06月05日
  • 简介
    随着机器人技术和增强现实应用越来越依赖于精确高效的6D物体位姿估计,需要在边缘设备上实现实时性,以实现更加交互式和响应性的系统。我们提出的“稀疏彩色编码网络”(SCCN)采用清晰简洁的管道设计,有效地满足了这一需求。SCCN在RGB图像中对目标物体进行像素级预测,利用关键物体几何特征的稀疏性加速透视n点(PnP)计算过程。此外,它引入了一种新颖的基于像素级几何的物体对称表示,与初始位姿预测无缝集成,有效地解决了对称物体的模糊性。在NVIDIA Jetson AGX Xavier上,SCCN在基准LINEMOD数据集和遮挡LINEMOD数据集上分别实现了每秒19帧和每秒6帧的估计速率,同时始终保持高估计精度。
  • 作者讲解
  • 图表
  • 解决问题
    论文旨在解决精确、高效的6D物体姿态估计问题,尤其是在边缘设备上实现实时性能。
  • 关键思路
    论文提出了一种名为Sparse Color-Code Net (SCCN)的方法,利用目标对象的几何特征的稀疏性来加速透视n点计算过程,并引入了一种新的基于像素级几何的对象对称性表示,有效地解决了对称对象的歧义性。
  • 其它亮点
    SCCN在保持高估计精度的同时,针对NVIDIA Jetson AGX Xavier,分别在LINEMOD数据集和Occlusion LINEMOD数据集上实现了19帧每秒(FPS)和6 FPS的估计速率。此外,论文提供了开源代码和实验细节,为后续研究提供了方便。
  • 相关研究
    在这个领域中,最近的相关研究包括:"Pix2Pose: Pixel-Wise Coordinate Regression of Objects for 6D Pose Estimation","BB8: A Scalable, Accurate, Robust to Partial Occlusion Method for Predicting the 3D Poses of Challenging Objects without Using Depth"等。
许愿开讲
PDF
原文
点赞 收藏
向作者提问
NEW
分享到Link

提问交流

提交问题,平台邀请作者,轻松获得权威解答~

向作者提问