【论文标题】Generalized Out-of-Distribution Detection: A Survey

【作者团队】Jingkang Yang, Kaiyang Zhou, Yixuan Li, Ziwei Liu

【发表时间】2021/10/21

【机 构】南洋理工、威斯康辛麦迪逊

【论文链接】https://arxiv.org/abs/2110.11334v1#

分布外(OOD)检测对于确保机器学习系统的可靠性和安全性至关重要。例如,在自动驾驶中,本文希望驾驶系统在检测到从未见过的异常场景或物体时发出警报并将控制权移交给人类,而不能做出安全的决定。这个问题在2017年首次出现,此后受到研究界越来越多的关注,导致开发了大量的方法,从基于分类的方法到基于密度的方法再到基于距离的方法。同时,其他几个问题在动机和方法上与OOD检测密切相关。这些问题包括异常检测、新颖性检测、开放集识别和离群检测。尽管有不同的定义和问题设置,但这些问题常常使从业者感到困惑,因此,一些现有的研究误用了术语。

在这项综述中,本文首先提出了一个被称为泛用分布外检测的通用框架,它包含了上述的五个问题。在本文的框架下,这五个问题可以被看作是特例或子任务,比较容易区分。然后,本文通过总结这五个领域的最新技术发展,对它们进行了全面的回顾,并展示了强大的预训练模型在各种任务和模式上都取得的惊人的成果,证明了强大的预训练Transformer可以显著改善一些特别困难的OOD任务。最后,本文以开放的挑战和潜在的研究方向来结束这项调查。

上图展示了泛用OOD检测框架的分类法。任务分类法有四个依据。(1)要检测的分布转变:任务侧重于检测协变量转变或语义转变;(2)ID数据类型:ID数据包含一个单类或多类;(3)任务是否需要ID分类;(4)归纳学习任务需要所有观测值。

本文主要总结如下:

  • 构建一个统一的框架。本文第一次系统地回顾了异常检测、新颖性检测、开放集识别、分布外检测和离群检测这五个密切相关的主题,并提出了一个比较统一的通用OOD检测框架。在这个框架下,可以比较和分析这五个子课题的相似性和差异。
  • 进行全面综述。本文对为每个子课题开发的现有方法进行了全面的回顾,特别是对计算机视觉和基于深度学习的方法进行了关注。尽管针对不同的问题环境,每个领域内开发的方法一般可以分为四组:
    • 基于密度的方法: 对正常数据的分布进行建模,其操作假设是异常测试数据的可能性较低,而正常数据在估计的密度模型下的可能性较高。
    • 基于重建的方法: 在分布内数据上训练的编码器-解码器框架通常对分布内和分布外样本产生不同的结果。模型性能的差异可以作为检测异常情况的指标来利用。
    • 基于分类的方法,将分布内数据划分为一个类别,问题转化为一个半监督问题。
    • 基于距离的方法。通过计算目标样本和一些内部存储原型之间的距离来检测异常情况,通常需要内存中的训练数据。
  • 总结了未来的研究方向。目前广义OOD检测领域中仍然存在的一些问题或局限。在调查的最后,本文讨论了未来研究的公开挑战和机会。

内容中包含的图片若涉及版权问题,请及时与我们联系删除