本文提出一种基于Exemplar Transformer的实时视觉目标跟踪网络,在CPU上速度高达47 FPS!据称是目前唯一的基于Transformer的实时跟踪器,代码将开源!
单位:ETH Zurich(Luc Van Gool 团队)
代码:github.com/visionml/pyt
论文:arxiv.org/abs/2112.0968

更复杂、更强大的神经网络模型的设计显著提升了视觉目标跟踪的最新技术水平。 这些进步可归因于更深层次的网络,或引入了新的构建块,例如Transformer。 然而,在追求提高跟踪性能的过程中,高效的跟踪架构却很少受到关注。

在本文中,我们介绍了 Exemplar Transformer,这是一种用于实时视觉目标跟踪的高效Transformer。

内容中包含的图片若涉及版权问题,请及时与我们联系删除