Multi-Frame to Single-Frame: Knowledge Distillation for 3D Object Detection
论文链接:https://arxiv.org/abs/2009.11859
本文使用知识蒸馏来弥合训练时对高质量输入进行训练的模型与推理时对低质量输入进行测试的模型之间的差距。在Waymo Open数据集上表现SOTA!优于StarNet、PointPillars等网络,作者单位:MIT, 谷歌, 斯坦福大学
用于自动驾驶的3D目标检测的一个常见难题是:高质量,密集的点云仅在训练期间可用,而在测试期间不可用。我们使用知识蒸馏来弥合训练时对高质量输入进行训练的模型与推理时对低质量输入进行测试的模型之间的差距。特别是,我们设计了一个两阶段的训练pipeline来进行点云目标检测。首先,我们在密集点云上训练目标检测模型,该密集点云是使用多个仅在训练时可用的信息从多个帧生成的。 然后,我们在稀疏单帧点云上训练模型的相同副本,并对两个模型的特征进行一致性正则化。 我们证明了此过程可以提高测试过程中低质量数据的性能,而不会增加额外开销。
内容中包含的图片若涉及版权问题,请及时与我们联系删除
评论
沙发等你来抢