Hydra-MDP: End-to-end Multimodal Planning with Multi-target Hydra-Distillation

2024年06月11日
  • 简介
    我们提出了Hydra-MDP,一种新颖的范例,采用多个教师在教师-学生模型中进行知识蒸馏。该方法利用来自人类和基于规则的教师的知识蒸馏来训练学生模型,该模型具有多头解码器,可以学习适合各种评估指标的多样化轨迹候选项。通过基于规则的教师的知识,Hydra-MDP以端到端的方式学习环境如何影响规划,而不是采用不可微的后处理。这种方法在Navsim挑战赛中获得了第一名,证明了在各种驾驶环境和条件下的显着泛化改进。代码将在\url{https://github.com/NVlabs/Hydra-MDP}上提供。
  • 图表
  • 解决问题
    本论文旨在提出一种新的多教师模型——Hydra-MDP,通过多个教师的知识蒸馏,从人类和基于规则的教师中学习,训练出一个具有多头解码器的学生模型,以学习适合不同评估指标的多样化轨迹候选项,以及在端到端的方法中学习环境如何影响规划,从而提高在不同驾驶环境和条件下的泛化能力。
  • 关键思路
    Hydra-MDP采用多教师模型,从人类和基于规则的教师中进行知识蒸馏,训练出一个具有多头解码器的学生模型,以学习适合不同评估指标的多样化轨迹候选项,并在端到端的方法中学习环境如何影响规划。
  • 其它亮点
    本论文的亮点包括:1. 提出了一种新的多教师模型——Hydra-MDP;2. 采用多个教师的知识蒸馏,从人类和基于规则的教师中学习;3. 使用具有多头解码器的学生模型,以学习适合不同评估指标的多样化轨迹候选项;4. 采用端到端的方法学习环境如何影响规划;5. 在Navsim挑战中取得了第一名的好成绩。
  • 相关研究
    在这个领域中,最近的相关研究包括:1.《Distilling Effective Supervision from Human Demonstrations for Autonomous Driving》;2. 《End-to-end Driving via Conditional Imitation Learning》;3. 《Imitation Learning for Autonomous Navigation: An Empirical Study》。
PDF
原文
点赞 收藏 评论 分享到Link

沙发等你来抢

去评论