ViTE: Virtual Graph Trajectory Expert Router for Pedestrian Trajectory Prediction

2025年11月15日
  • 简介
    行人轨迹预测对于确保自动驾驶、监控系统和城市规划应用中的安全性至关重要。早期的方法主要关注一跳的成对关系,而近期的研究则试图通过堆叠多个图神经网络(GNN)层来捕捉高阶交互。然而,这些方法面临一个根本性的权衡:层数不足可能导致模型感受野受限的“欠到达”问题,而层数过多又会带来高昂的计算成本。我们认为,一个有效的模型应当能够自适应地建模显式的一跳交互以及隐式的高阶依赖关系,而不应仅仅依赖于网络结构的深度。为此,我们提出了ViTE(虚拟图轨迹专家路由器),一种用于行人轨迹预测的新型框架。ViTE包含两个关键模块:一是虚拟图,通过引入动态的虚拟节点来建模长距离和高阶交互,而无需堆叠深层GNN;二是专家路由器,基于混合专家(Mixture-of-Experts)设计,根据社交上下文自适应地选择交互专家。这种组合使得模型能够在不同的交互模式下实现灵活且可扩展的推理。在三个基准数据集(ETH/UCY、NBA 和 SDD)上的实验表明,我们的方法始终达到最先进的性能,验证了其有效性与实际效率。
  • 作者讲解
  • 图表
  • 解决问题
    论文试图解决行人轨迹预测中如何有效建模高阶交互关系的问题。传统方法依赖堆叠多层图神经网络(GNN)来捕捉高阶社会交互,但面临模型深度不足导致感受野受限,或过深带来计算成本过高的问题。这并非全新问题,但在实际应用如自动驾驶和城市规划中仍具挑战性。
  • 关键思路
    提出ViTE框架,通过引入虚拟图(Virtual Graph)和专家路由机制(Expert Router)来替代深层GNN堆叠。虚拟节点动态建模长距离和高阶交互,避免深度堆叠;专家路由器基于上下文自适应选择交互模式,实现灵活推理。该思路突破了依赖深度提升感受野的传统范式,具有结构创新性。
  • 其它亮点
    在ETH/UCY、NBA和SDD三个基准数据集上均达到SOTA性能,验证了有效性与效率。实验设计充分,涵盖不同场景(校园、体育、城市)。方法具备可扩展性和较低计算开销。论文未明确提及是否开源代码,值得后续关注。未来可探索虚拟节点的可解释性、在多智能体系统中的泛化能力以及与其他模态(如视觉)的融合。
  • 相关研究
    1. Social-STGCNN: Spatio-Temporal Graph Convolutional Network for Pedestrian Trajectory Prediction 2. AgentFormer: Agent-Aware Transformers for Motion Forecasting 3. PnPNet: Conditional Priors for Probabilistic Trajectory Prediction 4. MAD: Multi-scale Action Decision for Autonomous Driving 5. Dynamic-Social-GAN: Dynamic Social Attention for Pedestrian Trajectory Prediction
许愿开讲
PDF
原文
点赞 收藏
向作者提问
NEW
分享到Link

提问交流

提交问题,平台邀请作者,轻松获得权威解答~

向作者提问