Dynamic Correlation Learning and Regularization for Multi-Label Confidence Calibration

2024年07月09日
  • 简介
    现代视觉识别模型通常表现出过度自信的特点,这是由于它们依赖于复杂的深度神经网络和单热目标监督所致,导致置信度得分不可靠,需要进行校准。虽然当前的置信度校准技术主要针对单标签场景,但缺乏对更实用和通用的多标签情境的关注。本文介绍了多标签置信度校准(MLCC)任务,旨在为多标签情境提供经过良好校准的置信度得分。与单标签图像不同,多标签图像包含多个对象,导致语义混淆和置信度得分的进一步不可靠性。现有的基于标签平滑的单标签校准方法未能考虑类别之间的相关性,而这对于解决语义混淆至关重要,因此产生了次优的性能。为了克服这些限制,我们提出了动态相关性学习和正则化(DCLR)算法,利用多粒度语义相关性来更好地建模语义混淆,实现自适应正则化。DCLR学习针对每个类别的动态实例级别和原型级别相似度,用于测量不同类别之间的语义相关性。在此基础上,我们构建自适应标签向量,将更高的值分配给具有强相关性的类别,从而促进更有效的正则化。我们建立了一个评估基准,重新实现了几种先进的置信度校准算法,并将其应用于领先的多标签识别(MLR)模型进行公平比较。通过广泛的实验,我们证明了DCLR在提供可靠的多标签置信度得分方面优于现有方法的卓越性能。
  • 图表
  • 解决问题
    该论文旨在解决多标签场景下,现有的置信度校准技术主要针对单标签场景,缺乏对实际应用的普适性和可靠性的问题。
  • 关键思路
    该论文提出了一种动态相关性学习和正则化算法(DCLR),通过多粒度语义相关性来更好地建模语义混淆,从而实现自适应正则化。
  • 其它亮点
    该论文在多标签识别(MLR)模型上进行了广泛的实验,证明了DCLR相对于现有方法在提供可靠置信度方面的优越性。论文还提供了一个评估基准,并重新实现了几种高级置信度校准算法,以进行公平比较。
  • 相关研究
    在最近的相关研究中,还有一些相关的研究,例如:《On Calibration of Modern Neural Networks》、《Multi-Label Image Recognition with Graph Convolutional Networks》等。
PDF
原文
点赞 收藏 评论 分享到Link

沙发等你来抢

去评论