DeCoDEx: Confounder Detector Guidance for Improved Diffusion-based Counterfactual Explanations

2024年05月15日
  • 简介
    深度学习分类器很容易陷入数据集中存在的主要混淆因素而非与目标类别相关的因果标记,导致泛化能力差和预测偏差。虽然通过反事实图像生成实现了可解释性,但在存在主要和多样化的人工痕迹的情况下允许准确的可解释性的偏差缓解策略仍未解决。在本文中,我们提出了DeCoDEx框架,并展示了如何在推理过程中利用外部预训练的二元人工痕迹检测器引导基于扩散的反事实图像生成器实现准确的可解释性。在CheXpert数据集上的实验,使用合成人工痕迹和真实视觉痕迹(支持设备),表明了所提出的方法成功地合成了反事实图像,改变了与胸腔积液相关的因果病理标记,同时保留或忽略了视觉痕迹。将DeCoDEx生成的图像与ERM和Group-DRO分类器进行增强,大大提高了各类别分布之外的少数群体的结果。代码公开在https://github.com/NimaFathi/DeCoDEx。
  • 作者讲解
  • 图表
  • 解决问题
    解决问题:论文试图解决深度学习分类器在面对数据集中的主导混淆因素时,倾向于将注意力集中在混淆因素而非目标类别的因果标记上,导致泛化能力差和预测偏差的问题。
  • 关键思路
    关键思路:论文提出了DeCoDEx框架,利用外部预训练的二进制混淆因素检测器,在推断过程中指导基于扩散的对抗生成器生成准确的可解释性图像。通过实验验证,DeCoDEx成功地合成了反事实图像,改变了与胸腔积液相关的因果病理标记,同时保留或忽略了视觉混淆因素。
  • 其它亮点
    其他亮点:本文在CheXpert数据集上进行实验,使用了合成的混淆因素和真实的视觉混淆因素(支持设备),证明了所提出方法的有效性。通过增强ERM和Group-DRO分类器的训练数据,DeCoDEx生成的图像显著提高了在每个类别的分布之外的少数群体的结果。作者公开了代码,可在https://github.com/NimaFathi/DeCoDEx上获取。
  • 相关研究
    相关研究:最近的相关研究包括使用对抗生成网络进行反事实图像生成的方法,以及使用深度学习进行混淆因素检测的方法。相关论文包括《Generating Counterfactual Explanations with Natural Language》和《A Unified Approach to Interpreting Model Predictions》等。
许愿开讲
PDF
原文
点赞 收藏
向作者提问
NEW
分享到Link

提问交流

提交问题,平台邀请作者,轻松获得权威解答~

向作者提问