视觉异常检测旨在通过无监督学习范式在图像中识别异常区域,随着工业检测和医学病变检测等领域中对其应用需求和价值的增加。尽管近年来取得了显著进展,但在实际的多类别设置下,缺乏全面的基准来充分评估各种主流方法的性能。缺乏标准化的实验设置可能导致训练时期、分辨率和度量结果的潜在偏差,进而导致错误结论。本文通过提出一个全面的视觉异常检测基准\textbf{\textit{ADer}}来解决这个问题,该基准是一个高度可扩展的模块化框架,可用于新方法的集成。该基准包括来自工业和医学领域的多个数据集,实现了15种最先进的方法和9种全面的度量标准。此外,我们开源了GPU辅助的\href{https://pypi.org/project/ADEval}{ADEval}包,以解决度量标准(如耗时的mAU-PRO)在大规模数据上的缓慢评估问题,将评估时间显著缩短了\textit{1000倍}以上。通过广泛的实验结果,我们客观地揭示了不同方法的优缺点,并提供了多类别视觉异常检测面临的挑战和未来方向的见解。我们希望\textbf{\textit{ADer}}将成为该领域研究人员和实践者的有价值的资源,促进更加稳健和可推广的异常检测系统的发展。完整的代码已附在附录中,并在\url{https://github.com/zhangzjn/ader}上开源。
提问交流