Lifting Multi-View Detection and Tracking to the Bird's Eye View

2024年03月19日
  • 简介
    利用多视角聚合技术是解决多目标跟踪和检测中遮挡和漏检等挑战的一种有前途的解决方案。最近在多视角检测和三维物体识别方面的进展,通过将所有视角投影到地面平面上,并从鸟瞰图进行检测分析,显著提高了性能。本文比较了现代lifting方法(包括无参数和参数化方法)和多视角聚合方法。此外,我们提出了一种架构,该架构聚合多个时间步骤的特征以学习鲁棒的检测,并结合外观和运动基础线索进行跟踪。大多数当前的跟踪方法要么专注于行人,要么专注于车辆。在我们的工作中,我们将两个分支结合起来,并在跨场景设置下增加了新的挑战。我们的方法适用于两个领域的三个公共数据集:(1)行人:Wildtrack和MultiviewX,以及(2)路边感知:Synthehicle,在检测和跟踪方面实现了最先进的性能。
  • 图表
  • 解决问题
    本论文旨在解决多物体跟踪和检测中遮挡和漏检等挑战,通过多视角聚合的方法提高检测和跟踪性能。
  • 关键思路
    论文提出了一种将多个时间步的特征进行聚合的架构,结合外观和运动信息进行跟踪和检测。同时,将行人和车辆两个分支结合,并在跨场景设置下进行实验,实现了在三个公共数据集上的最新性能。
  • 其它亮点
    论文比较了现代的无参数和参数化lifting方法与多视角聚合的方法,并提供了开源代码。实验使用了三个公共数据集,包括行人和车辆两个分支,并在跨场景设置下进行实验,实现了最新的检测和跟踪性能。
  • 相关研究
    近期的相关研究包括: 1. "A Survey of Multi-View Human Pose Estimation" 2. "Multi-View Object Detection with Feature Perspective Transformation" 3. "Multi-View 3D Object Detection Network for Autonomous Driving"
PDF
原文
点赞 收藏 评论 分享到Link

沙发等你来抢

去评论