- 简介机器学习模型在关键决策过程中的广泛应用凸显了需要发现和缓解偏差的策略。鉴别一个有偏见的系统背后的原因并不容易,因为很多时候它们与难以发现的隐藏性虚假相关性有关。标准方法依靠偏见审计,通过分析预定义的数据样本子组的模型性能进行,通常由共同属性(如人的性别或种族)或定义语义一致的图像组的其他特定属性进行描述。然而,并不总是可能事先知道定义视觉识别系统失效模式的特定属性。最近的方法提出利用大型视觉语言模型发现这些组,这些模型可以提取交叉模态嵌入并生成文本描述,以描述某个模型表现不佳的子组。在这项工作中,我们认为加入视觉解释(例如通过GradCAM或其他方法生成的热图)可以提高这种偏差发现和缓解框架的性能。为此,我们介绍了一种简单而有效的技术,即基于视觉的偏差发现和缓解(ViG-Bias),它可以集成到各种现有框架中,以提高发现和缓解性能。我们的全面评估显示,加入视觉解释可以增强现有技术(如DOMINO、FACTS和Bias-to-Text)在多个具有挑战性的数据集上的性能,包括CelebA、Waterbirds和NICO++。
- 解决问题本论文旨在解决机器学习模型在重要决策过程中出现的偏见问题,并提出了一种新的ViG-Bias技术来发现和缓解这些偏见。
- 关键思路ViG-Bias技术结合了视觉解释和已有的偏见发现和缓解框架,提高了发现和缓解性能。
- 其它亮点论文使用了多个数据集进行综合评估,证明了ViG-Bias技术的有效性。此外,论文提供了开源代码,方便其他研究人员使用和扩展。
- 相关研究包括DOMINO、FACTS和Bias-to-Text等偏见发现和缓解框架,以及使用大型视觉语言模型进行跨模态嵌入的研究。
沙发等你来抢
去评论
评论
沙发等你来抢