GCN-DevLSTM: Path Development for Skeleton-Based Action Recognition

2024年03月22日
  • 简介
    骨架动作识别(SAR)在视频中是计算机视觉中一项重要但具有挑战性的任务。目前SAR的最新最先进模型主要基于图卷积神经网络(GCN),GCN在提取骨架数据的空间信息方面非常强大。然而,目前尚不清楚这种基于GCN的模型能否有效地捕捉到人类动作序列的时间动态。为此,我们提出了DevLSTM模块,该模块利用了路径发展——一种基于李群结构的顺序数据的原则性和简约性表示。路径发展源自粗略路径理论,可以有效地捕捉高维流数据中事件的顺序,实现大规模降维,并显著增强LSTM模块。我们提出的G-DevLSTM模块可以方便地插入时间图中,补充现有先进的基于GCN的模型。我们在NTU60、NTU120和Chalearn2013数据集上的实证研究表明,我们提出的混合模型在SAR任务中显著优于当前表现最佳的方法。代码可在https://github.com/DeepIntoStreams/GCN-DevLSTM上获得。
  • 图表
  • 解决问题
    本论文旨在解决基于骨架的动作识别(SAR)中的时间动态问题,并验证使用DevLSTM模块能否有效地捕捉时间动态。
  • 关键思路
    本论文提出了DevLSTM模块,利用路径发展来提高LSTM模块的性能,从而有效地捕捉高维流数据中的事件顺序。
  • 其它亮点
    本文在NTU60、NTU120和Chalearn2013数据集上进行了实验,证明了G-DevLSTM模型在SAR任务中的显著性能优于当前最佳方法。研究者提供了开源代码 https://github.com/DeepIntoStreams/GCN-DevLSTM。
  • 相关研究
    在这个领域中,最近的相关研究包括:'Spatio-Temporal Graph Convolutional Networks for Skeleton-Based Action Recognition'、'Temporal Convolutional Networks for Action Segmentation and Detection'、'Learning Spatio-Temporal Representation with Pseudo-3D Residual Networks'等。
PDF
原文
点赞 收藏 评论 分享到Link

沙发等你来抢

去评论