Unleashing the Potential of Tracklets for Unsupervised Video Person Re-Identification

2024年06月20日
  • 简介
    视频行人重识别方法具有丰富的时空信息,展现了广阔的前景。尽管使用现成的跟踪模型可以轻松获得轨迹,但标注身份仍然昂贵且不切实际。因此,一些基于视频的方法提出仅使用少量身份注释或摄像机标签来促进特征学习。它们还简单地平均每个轨迹的帧特征,忽略了轨迹内的意外变化和内在身份一致性。在本文中,我们提出了自监督精炼聚类(SSR-C)框架,不依赖任何注释或辅助信息来促进无监督视频行人重识别。具体而言,我们首先提出了噪声过滤轨迹分区(NFTP)模块,以减少由嘈杂的跟踪结果引起的轨迹特征偏差,并将噪声过滤轨迹顺序分成“子轨迹”。然后,我们使用从轨迹分区中得到的自监督信号对子轨迹进行聚类和进一步合并,通过渐进策略增强以生成可靠的伪标签,促进类内跨轨迹聚合。此外,我们提出了类平滑分类(CSC)损失,以有效促进模型学习。在MARS和DukeMTMC-VideoReID数据集上进行的广泛实验表明,我们提出的SSR-C框架在无监督视频行人重识别方面取得了最先进的结果,并且与先进的监督方法相当。
  • 作者讲解
  • 图表
  • 解决问题
    本论文旨在解决视频行人重识别中标注身份信息成本高昂的问题,提出了一种无监督的方法。
  • 关键思路
    论文提出了Self-Supervised Refined Clustering (SSR-C)框架,通过噪声过滤的轨迹分割和子轨迹聚类,不依赖任何注释或辅助信息来促进无监督视频行人重识别。
  • 其它亮点
    论文的实验结果表明,所提出的方法在MARS和DukeMTMC-VideoReID数据集上实现了最先进的结果,并且与先进的监督方法相当。此外,论文还提出了Class Smoothing Classification (CSC)损失以有效促进模型学习。
  • 相关研究
    与此相关的研究包括:'Unsupervised Person Re-identification: Clustering and Fine-tuning'、'Unsupervised Person Re-identification via Softened Similarity Learning'、'Unsupervised Deep Video Hashing via Semantics-Preserving Adversarial Learning'等。
许愿开讲
PDF
原文
点赞 收藏
向作者提问
NEW
分享到Link

提问交流

提交问题,平台邀请作者,轻松获得权威解答~

向作者提问