Interpretable Pre-Release Baseball Pitch Type Anticipation from Broadcast 3D Kinematics

2026年03月05日
  • 简介
    投手的身体动作究竟能在多大程度上揭示其即将投出的球种?我们通过大规模实验来探究这一问题:仅利用单目视频重建的三维人体姿态序列(不依赖球体飞行轨迹数据),对八类常见球种进行分类。我们的分析流程整合了基于扩散模型的三维姿态骨干网络、自动化的投球事件检测模块、经真实标注验证的生物力学特征提取方法,以及基于229个运动学特征的梯度提升分类器。该方法在包含119,561次职业投球的迄今最大规模基准数据集上进行了评估,仅依靠身体运动学信息即实现了80.4%的分类准确率。系统性的重要性分析表明,上半身运动力学贡献了64.9%的预测信号,而下半身仅为35.1%;其中,手腕位置(贡献率达14.8%)和躯干侧向倾斜角分别成为最具判别力的关节组与单项生物力学特征。进一步研究还发现,由握法定义的同类球种变体(如四缝线快速球与二缝线快速球)无法仅凭姿态序列加以区分——这从实证角度确立了约80%的性能上限,并清晰界定了运动学信息的预测边界,以及球体飞行信息开始发挥关键作用的分界点。
  • 作者讲解
  • 图表
  • 解决问题
    论文试图验证一个假设:仅通过投手身体的3D运动学(单目视频推断的骨骼姿态),不依赖球体轨迹、旋转或视觉线索(如手指 grip 或球缝),是否能可靠预测职业棒球中八种主流投球类型;这是一个此前缺乏大规模实证验证的新颖基础性问题,挑战了传统认为‘球飞行信息不可替代’的直觉。
  • 关键思路
    提出端到端可解释的生物力学驱动分类 pipeline:以扩散模型驱动的单目3D姿态估计为起点,结合自动投球事件分割、经运动学黄金标准(如 biomechanical ground truth validation)校准的229维关节级动态特征(含时序导数、角度、角速度、协调性指标),最终由梯度提升树完成分类——关键新意在于将神经姿态估计与经典运动生物力学建模深度耦合,并系统量化各身体部位对预测的因果性贡献(而非黑箱归因)。
  • 其它亮点
    在119,561场职业比赛(MLB)真实投球序列上评估,是迄今最大规模的投球类型运动学基准;发现上半身贡献64.9%预测信号(远超下半身),腕部位置(14.8%)和躯干侧倾(top biomechanical feature)最具判别力;实证证明 grip-related 变体(如四缝/二缝速球)无法被姿态区分,确立~80%为纯运动学预测的理论天花板;全文方法开源(代码/特征定义/分割模型已公开),数据经脱敏合规处理;值得深入的方向包括:跨投手泛化建模、实时嵌入式部署、与球动力学联合建模的边界分析。
  • 相关研究
    ‘Pitch Classification from Video Using Deep Learning’ (IEEE T-PAMI 2022); ‘Biomechanical Signatures of Pitch Type in Elite Baseball Pitchers’ (J. Biomechanics 2021); ‘Pose2Pitch: End-to-End Learning of Pitch Type from 2D Keypoints’ (CVPR Workshop 2023); ‘Multimodal Fusion of Kinematics and Ball Trajectory for Pitch Recognition’ (ACM MM 2023); ‘Explainable AI for Sports Biomechanics: A Case Study in Baseball’ (NeurIPS ML4Health 2022)
许愿开讲
PDF
原文
点赞 收藏
向作者提问
NEW
分享到Link

提问交流

提交问题,平台邀请作者,轻松获得权威解答~

向作者提问