Unified Spatial-Temporal Edge-Enhanced Graph Networks for Pedestrian Trajectory Prediction

2025年02月04日
  • 简介
    行人轨迹预测旨在根据历史路径来预测未来的移动。时空(ST)方法通常分别建模行人之间的空间交互和个体的时间依赖性。它们忽略了不同行人在各个时间步之间交互的直接影响(即高阶跨时间交互)。这限制了它们捕捉时空依赖关系的能力,从而影响预测性能。为了解决这些局限性,我们提出了UniEdge,并引入了三项主要设计。首先,我们引入了一种统一的时空图数据结构,将高阶跨时间交互简化为一阶关系,使得可以在单一步骤中学习时空依赖关系。这避免了多步骤聚合导致的信息损失。其次,传统的图神经网络(GNN)专注于聚合行人节点特征,而忽视了编码在边特征中的隐式交互模式的传播。我们提出了一种新的双图网络——边到边-节点到节点图卷积(E2E-N2N-GCN),它联合建模行人之间的显式节点到节点社会交互以及这些交互模式之间的隐式边到边影响传播。最后,为了克服自回归架构的有限感受野和捕捉长距离依赖性的挑战,我们引入了一个基于变压器编码器的预测器,实现了对时间相关性的全局建模。UniEdge在多个数据集上超越了现有最先进的方法,包括ETH、UCY和SDD。
  • 作者讲解
  • 图表
  • 解决问题
    该论文旨在解决行人轨迹预测中现有空间-时间(ST)方法的局限性,特别是这些方法通常分别建模行人之间的空间交互和个体的时间依赖性,而忽略了不同行人在多个时间步骤之间的高阶跨时间交互。这限制了它们捕捉ST相互依赖性的能力,并影响预测性能。
  • 关键思路
    论文提出了一种名为UniEdge的新框架,具有三个主要设计:1) 引入统一的ST图数据结构,将高阶跨时间交互简化为一阶关系,从而在一个步骤中学习ST相互依赖性;2) 提出Edge-to-Edge-Node-to-Node Graph Convolution (E2E-N2N-GCN),一种新型双图网络,同时建模显式的N2N社会交互和隐式的E2E影响传播;3) 引入基于Transformer编码器的预测器,以克服自回归架构在捕捉长程依赖方面的局限性。这些设计共同提升了行人轨迹预测的准确性。
  • 其它亮点
    论文使用ETH、UCY和SDD等多个数据集进行了实验,证明了UniEdge在多个基准测试中的优越性能。此外,作者还开源了代码,使得其他研究人员可以复现结果并进一步改进。未来值得深入研究的方向包括扩展到更复杂的场景以及与其他多智能体系统结合。
  • 相关研究
    最近在这个领域中,相关研究还包括《Social LSTM: Human Trajectory Prediction in Crowded Spaces》、《Social GAN: Socially Acceptable Trajectory Prediction with Generative Adversarial Networks》和《Desire: Distant Future Prediction in Dynamic Scenes with Interacting Agents》等。这些研究都试图通过不同的方法来改进行人轨迹预测,但UniEdge的独特之处在于它综合考虑了高阶跨时间交互和全局时间相关性。
许愿开讲
PDF
原文
点赞 收藏
向作者提问
NEW
分享到Link

提问交流

提交问题,平台邀请作者,轻松获得权威解答~

向作者提问