- 简介自动驾驶汽车(AV)系统的安全保障基石是强大的感知模型。然而,在道路上遇到的物体呈现出长尾分布,罕见或未知的类别给部署的感知模型带来挑战。这需要一个昂贵的过程,不断用大量人力资源来筛选和注释数据。我们提出利用最近在视觉语言和大型语言模型方面的进展,设计一个自动数据引擎(AIDE),自动识别问题,高效筛选数据,通过自动标注改进模型,并通过生成不同场景来验证模型。这个过程是迭代的,允许模型不断自我改进。我们进一步建立了AV数据集上的开放世界检测基准,全面评估各种学习模式,展示了我们方法在降低成本的同时表现出卓越的性能。
- 图表
- 解决问题自动驾驶系统中的感知模型需要处理长尾分布的数据,其中罕见或未知的类别对模型提出挑战,需要昂贵的数据标注和人力成本。本文旨在通过利用视觉语言和大型语言模型,设计一个自动化数据引擎(AIDE)来自动识别问题,高效地筛选和标注数据,通过自动标注提高模型性能,通过生成多样化场景验证模型。这个过程是迭代的,允许模型的持续自我提高。此外,本文建立了一个开放世界检测的AV数据集基准,全面评估各种学习范式,在降低成本的同时展示了我们方法的优异性能。
- 关键思路通过结合视觉语言和大型语言模型,设计一个自动化数据引擎(AIDE)来自动识别问题,高效地筛选和标注数据,通过自动标注提高模型性能,通过生成多样化场景验证模型。
- 其它亮点本文提出了一个自动化数据引擎(AIDE),通过结合视觉语言和大型语言模型来解决AV系统中长尾分布数据的问题。作者通过建立一个开放世界检测的AV数据集基准,全面评估各种学习范式,并展示了AIDE方法的优异性能。实验结果表明,AIDE方法能够有效地提高模型性能,降低数据标注和人力成本。
- 最近在这个领域中,还有一些相关的研究,例如《Learning to Learn from Noisy Labeled Data》、《AutoAugment: Learning Augmentation Policies from Data》、《EfficientNet: Rethinking Model Scaling for Convolutional Neural Networks》等。
沙发等你来抢
去评论
评论
沙发等你来抢