Trajeglish: Learning the Language of Driving Scenarios

2023年12月07日
  • 简介
    自动驾驶开发长期以来的挑战之一是从记录的驾驶日志中模拟动态驾驶场景。为了实现这一功能,我们应用离散序列建模工具来建模车辆、行人和骑车人在驾驶场景中的交互。使用简单的数据驱动分词方案,我们使用小词汇量将轨迹离散化到厘米级分辨率。然后,我们使用类似GPT的编码器-解码器模型来建模运动令牌的多智能体序列,该模型在时间上是自回归的,并考虑了智能体之间的时间步内交互。从我们的模型中抽样的场景展现出最先进的逼真度;我们的模型在Waymo Sim Agents Benchmark中排名第一,超过了之前的工作,逼真度元指标提高了3.3%,交互元指标提高了9.9%。我们在完全自主和部分自主设置下分析了我们的建模选择,并展示了我们的模型所学习的表示可以快速适应nuScenes上的性能提升。我们还评估了我们的模型在参数数量和数据集大小方面的可扩展性,并使用我们模型的密度估计来量化上下文长度和时间步内交互对交通建模任务的显著性。
  • 图表
  • 解决问题
    论文旨在通过使用离散序列建模工具,模拟动态驾驶场景,从而解决自动驾驶开发中的一个长期挑战。
  • 关键思路
    通过使用离散化轨迹和GPT-like编码器-解码器模型,模拟车辆、行人和骑车人在驾驶场景中的交互,并在时间上自回归。
  • 其它亮点
    该模型在Waymo Sim Agents Benchmark中表现优异,超过以前的工作,同时还可以通过快速适应来提高在nuScenes上的性能。论文还评估了模型的可扩展性和使用的数据集,同时使用密度估计量化了上下文长度和时间步内交互对交通建模任务的重要性。
  • 相关研究
    相关研究包括使用深度学习模型进行自动驾驶场景建模的其他论文,如《End-to-End Learning of Driving Models from Large-Scale Video Datasets》和《Learning a Driving Simulator》。
PDF
原文
点赞 收藏 评论 分享到Link

沙发等你来抢

去评论