Slicing Through Bias: Explaining Performance Gaps in Medical Image Analysis using Slice Discovery Methods

2024年06月17日
  • 简介
    机器学习模型在医学图像分析方面已经取得了较高的整体准确度。然而,特定患者群体的性能差异对其临床效用、安全性和公平性构成了挑战。这可能会影响已知的患者群体,例如基于性别、年龄或疾病亚型的患者群体,以及以前未知和未标记的群体。此外,这种观察到的性能差异的根本原因通常很难揭示,从而阻碍了缓解措施的实施。本文利用切片发现方法(SDMs)识别可解释的数据子集中的性能下降,以及制定关于观察到的性能差异原因的假设,以解决这些问题。我们引入了一种新的SDM,并在胸部X线片的气胸和肺不张分类的案例研究中应用它。我们的研究证明了SDMs在假设制定方面的有效性,并提供了先前观察到但无法解释的男女患者在广泛使用的胸部X线数据集和模型中性能差异的解释。我们的发现表明,在两个分类任务中都存在捷径学习,分别通过胸部引流管和心电图导线的存在来实现。这些捷径特征在性别间的普遍程度差异似乎导致观察到的分类性能差距,代表了捷径学习和模型公平性分析之间以前未被充分认识的相互作用。
  • 图表
  • 解决问题
    本论文旨在解决医学图像分析中特定患者群体表现差异的问题,提高模型的临床实用性、安全性和公平性。
  • 关键思路
    通过利用Slice Discovery Methods (SDMs)来识别低效数据的可解释子集,从而推断出性别、年龄或疾病亚型等因素对模型表现差异的影响,并提出相应的假设。
  • 其它亮点
    本文提出了一种新的SDM方法,并在胸部X线片的气胸和肺不张分类案例中进行了实验,发现性别差异对模型表现差异的影响是由于捷径学习中胸腔引流管和心电图导线等捷径特征的不同。
  • 相关研究
    近期相关研究包括使用深度学习技术进行医学图像分类和分割的工作。例如,标题为“Automated Detection of Diabetic Retinopathy in Retinal Fundus Photographs”的论文使用深度学习方法来诊断糖尿病视网膜病变。
PDF
原文
点赞 收藏 评论 分享到Link

沙发等你来抢

去评论