ETTrack: Enhanced Temporal Motion Predictor for Multi-Object Tracking

2024年05月24日
  • 简介
    许多多目标跟踪(Multi-Object Tracking, MOT)方法利用运动信息将所有检测到的物体关联到各帧中。然而,许多依赖于基于滤波算法(如卡尔曼滤波器)的方法通常在线性运动场景下表现良好,但难以准确预测正在经历复杂和非线性运动的物体的位置。为了解决这些场景,我们提出了一种基于运动的MOT方法,名为增强时间运动预测器(ETTrack)。具体而言,运动预测器集成了一个Transformer模型和一个时间卷积网络(Temporal Convolutional Network, TCN)来捕捉短期和长期的运动模式,并基于历史运动信息预测单个物体的未来运动。此外,我们提出了一种新颖的动量校正损失函数,它提供了有关物体运动方向的额外信息,在训练期间使运动预测器能够快速适应运动变化并更准确地预测未来运动。我们的实验结果表明,ETTrack在DanceTrack和SportsMOT上的表现与最先进的跟踪器相当,分别在HOTA指标上得分为56.4%和74.4%。
  • 作者讲解
  • 图表
  • 解决问题
    提出了一种基于运动信息的多目标跟踪方法,旨在解决卡尔曼滤波等线性运动算法无法准确预测非线性运动物体位置的问题。
  • 关键思路
    提出了一种增强的时间运动预测器(ETTrack),它结合了Transformer模型和TCN来捕捉短期和长期运动模式,并根据历史运动信息预测单个物体的未来运动。此外,提出了一种新的动量修正损失函数,提供了有关物体运动方向的附加信息,使运动预测器能够快速适应运动变化并更准确地预测未来运动。
  • 其它亮点
    论文在DanceTrack和SportsMOT数据集上进行了实验,与最先进的跟踪器相比,ETTrack在HOTA指标上分别获得了56.4%和74.4%的竞争性表现。
  • 相关研究
    最近的相关研究包括:MOTDT,JDE等。
许愿开讲
PDF
原文
点赞 收藏
向作者提问
NEW
分享到Link

提问交流

提交问题,平台邀请作者,轻松获得权威解答~

向作者提问