Hydra-MDP: End-to-end Multimodal Planning with Multi-target Hydra-Distillation

向作者提问

NEW

简介

我们提出了Hydra-MDP，这是一种新的范例，采用多个教师在教师-学生模型中。这种方法使用来自人类和基于规则的教师的知识蒸馏来训练学生模型，该模型具有多头解码器，以学习适合各种评估指标的多样化轨迹候选项。通过基于规则的教师的知识，Hydra-MDP以端到端的方式学习环境如何影响计划，而不是采用不可微分的后处理。该方法在Navsim挑战赛中取得了第一名，证明了在各种驾驶环境和条件下的泛化显着提高。代码将在https://github.com/woxihuanjiangguo/Hydra-MDP上提供。
作者讲解

目前尚无作者解读视频，你可点击下方【许愿开讲】按钮，许愿作者开讲~
图表
解决问题

本论文试图通过使用多个教师的知识蒸馏来训练学生模型，解决驾驶环境多样化的问题，提高驾驶模型的泛化能力。
关键思路

Hydra-MDP采用多头解码器来学习适应各种评估指标的多样化轨迹候选项，利用规则教师的知识，以端到端的方式学习环境对规划的影响，而不是采用不可微分的后处理方法。
其它亮点

本论文的亮点包括使用多个教师的知识蒸馏来提高模型的泛化能力，以及采用多头解码器来学习适应多种评估指标的多样化轨迹候选项。实验结果表明，Hydra-MDP方法在Navsim挑战赛中取得了第一名的成绩，并在不同驾驶环境和条件下实现了显著的改进。作者已经开源了代码。
相关研究

在这个领域中，还有一些相关的研究，例如“End-to-end Learning of Driving Models from Large-scale Video Datasets”和“Learning to Drive using Inverse Reinforcement Learning and Deep Q-Networks”。

许愿开讲

PDF

原文

点赞收藏

向作者提问

NEW

分享到Link

提问交流

提交问题，平台邀请作者，轻松获得权威解答～

向作者提问