BiggerGait: Unlocking Gait Recognition with Layer-wise Representations from Large Vision Models

2025年05月23日
  • 简介
    基于大型视觉模型(LVM)的步态识别已经取得了令人印象深刻的性能。然而,现有的 LVM 方法可能过度强调步态先验,而忽视了 LVM 本身的内在价值,特别是其多层结构中丰富且独特的表示能力。为了充分挖掘 LVM 的潜力,本文研究了分层表示对下游识别任务的影响。我们的分析表明,LVM 的中间层在不同任务中提供了互补的特性,即使没有精心设计的步态先验,整合这些层的表示也能带来显著的性能提升。基于这一发现,我们提出了一种简单且通用的 LVM 基础方法,用于步态识别,命名为 BiggerGait。在 CCPG、CAISA-B*、SUSTech1K 和 CCGR_MINI 数据集上的全面评估证明,BiggerGait 在域内和跨域任务中均表现出优越性,确立了其作为步态表示学习的简单而实用的基准方法的地位。所有模型和代码将公开发布。
  • 图表
  • 解决问题
    该论文试图解决现有基于大视觉模型(LVM)的步态识别方法过于依赖步态先验知识而忽视了LVM自身多层丰富表示潜力的问题。这是一个新颖的研究方向,专注于挖掘LVM中间层特征对下游任务的价值。
  • 关键思路
    论文提出通过分析LVM不同层的表示特性,并整合这些互补特征以提升步态识别性能。相比传统方法,它强调利用LVM本身的多层次特征而非依赖复杂的步态先验设计,从而提出了一种简单且通用的基线模型BiggerGait。
  • 其它亮点
    实验在多个数据集(CCPG、CAISA-B*、SUSTech1K和CCGR_MINI)上验证了BiggerGait的有效性,展示了其在跨域和同域任务中的优越性能。此外,作者计划公开所有代码和模型,为后续研究提供了便利。未来可以进一步探索如何更高效地结合LVM的不同层特征以及优化其计算成本。
  • 相关研究
    近期相关研究包括:1)《Learning Discriminative Features for Gait Recognition via Vision Transformers》;2)《Cross-Domain Gait Recognition with Adversarial Feature Alignment》;3)《Deep Gait: A Survey on Gait Recognition with Deep Learning》。这些工作主要关注于如何利用深度学习改进步态识别,但较少涉及对LVM多层特征的系统性分析。
许愿开讲
PDF
原文
点赞 收藏 评论 分享到Link

沙发等你来抢

去评论