Benchmarking the Attribution Quality of Vision Models

2024年07月16日
  • 简介
    归因映射是解释计算机视觉模型运行方式的最常用工具之一。它们为输入特征分配重要性分数,指示每个特征对深度神经网络预测的相关性。虽然已经有很多研究提出了新的归因方法,但它们的适当评估仍然是一个难题。在这项工作中,我们提出了一种新的评估协议,克服了广泛使用的增量删除协议的两个基本限制,即域外问题和缺乏模型间比较。这使我们能够评估23种归因方法以及流行视觉模型的8种不同设计选择如何影响它们的归因质量。我们发现,本质可解释模型优于标准模型,并且原始归因值显示出比以前的工作更高的归因质量。此外,我们展示了当改变网络设计时归因质量的一致变化,表明一些标准设计选择促进了归因质量。
  • 图表
  • 解决问题
    本文旨在解决评估计算机视觉模型的归因方法的问题,提出了一种新的评估协议,克服了现有协议的两个基本限制。
  • 关键思路
    本文提出了一种新的评估协议,用于评估23种归因方法和8种不同设计选择的流行视觉模型对归因质量的影响,并发现内在可解释模型优于标准模型,原始归因值比以前的工作中已知的归因质量更高。
  • 其它亮点
    本文的实验设计了一个新的评估协议来评估归因方法,使用了多个数据集来评估23种归因方法和8种不同设计选择的流行视觉模型,发现内在可解释模型优于标准模型,原始归因值比以前的工作中已知的归因质量更高。本文还发现,当改变网络设计时,归因质量的变化是一致的。
  • 相关研究
    与本文相关的研究包括解释性机器学习、计算机视觉解释性、归因方法和评估协议等方面的研究。例如,'Towards better understanding of gradient-based attribution methods for deep neural networks'、'Axiomatic Attribution for Deep Networks'等。
PDF
原文
点赞 收藏 评论 分享到Link

沙发等你来抢

去评论