- 简介图像理解是计算机视觉中的基础任务,近期应用于足球姿势分析。然而,现有的公开可用数据集缺乏全面的信息,尤其是姿势序列和2D姿势注释。此外,当前的分析模型通常依赖于可解释的线性模型(例如PCA和回归),限制了它们捕捉复杂和多样情境中的非线性时空关系的能力。为了解决这些问题,我们在足球广播视频中引入了3D Shot Posture(3DSP)数据集,这是我们所知道的带有2D姿势注释的最广泛的体育图像数据集。此外,我们提出了3DSP-GRAE(Graph Recurrent AutoEncoder)模型,这是一种非线性的方法,用于嵌入姿势序列。此外,我们提出了AutoSoccerPose,这是一个旨在半自动化2D和3D姿势估计和姿势分析的流程。虽然实现完全自动化的目标具有挑战性,但我们提供了一个基础性的基准,扩展了其在注释数据范围之外的实用性。我们在SoccerNet和3DSP数据集上验证了AutoSoccerPose,并基于3DSP提供了姿势分析结果。数据集、代码和模型可在以下网址获得:https://github.com/calvinyeungck/3D-Shot-Posture-Dataset。
- 图表
- 解决问题本论文旨在解决计算机视觉中图像理解的基础任务,即在足球广播视频中进行姿势分析,而现有的公开数据集缺乏全面的信息和2D姿势注释。
- 关键思路论文提出了3DSP数据集和3DSP-GRAE模型。3DSP数据集是迄今为止最广泛的具有2D姿势注释的体育图像数据集。3DSP-GRAE模型是一种非线性方法,用于嵌入姿势序列。
- 其它亮点论文还提出了AutoSoccerPose管道,旨在半自动化2D和3D姿势估计和姿势分析。论文在SoccerNet和3DSP数据集上验证了AutoSoccerPose,并基于3DSP提供了姿势分析结果。数据集、代码和模型可在GitHub上获得。
- 最近的相关研究包括:SoccerNet、OpenPose、DeepPoseKit和AlphaPose等。
沙发等你来抢
去评论
评论
沙发等你来抢