Learning to Fuse Asymmetric Feature Maps in Siamese Trackers 论文链接:https://arxiv.org/abs/2012.02776 本文提出一种可学习的非对称卷积:ACM,可高效融合Siamese跟踪器中不同大小的特征图,以显著提高孪生跟踪器性能,如SiamFC、SiamBAN和SiamRPN++等。作者单位:北京理工大学, IIAI, MBZUAI

近年来,基于孪生(Siamese)的跟踪器在视觉跟踪方面取得了令人鼓舞的性能。最新的基于Siamese的跟踪器通常采用深度互相关(DW-XCorr),以从两个特征图(目标和搜索区域)获得多通道相关信息。但是,DW-XCorr在基于连体的跟踪中有几个局限性:它很容易被干扰因素所欺骗,具有较少的激活通道,并且对对象边界的辨别力较弱。此外,DW-XCorr是一个手工制作的无参数模块,不能完全受益于大规模数据的离线学习。 我们提出了一个可学习的模块,称为非对称卷积(ACM),该模块学会了在大规模数据的离线训练中更好地捕获语义相关信息。与DW-XCorr及其前身(XCorr)视单个特征图为卷积内核不同,我们的ACM会将级联特征图上的卷积运算分解为两个数学上等效的运算,从而避免了使用特征图在连接期间具有相同的大小(宽度和高度)。我们的ACM可以将有用的先验信息(例如边框大小)与标准视觉功能结合在一起。此外,ACM可以轻松集成到基于DW-XCorr或XCorr的现有孪生跟踪器中。为了证明其泛化能力,我们将ACM集成到三个代表性的跟踪器中:SiamFC,SiamRPN ++和SiamBAN。我们的实验揭示了提出ACM的优势,它在六个跟踪基准上均优于现有方法。在LaSOT测试设备上,基于ACM的跟踪器在成功率(AUC)方面比基线提高了5.8%。

内容中包含的图片若涉及版权问题,请及时与我们联系删除