An Empirical Study on the Fairness of Foundation Models for Multi-Organ Image Segmentation

2024年06月18日
  • 简介
    这篇文章讨论了大型分割基础模型的公平性问题。以Segment Anything Model (SAM)为代表的分割基础模型在医学图像领域引起了越来越多的关注。早期的开创性研究主要集中在从整体准确性和效率的角度评估和改进SAM的性能,但很少关注公平性问题。这种疏忽引起了关于潜在性能偏差的问题,这些偏差可能与nnU-Net等任务特定的深度学习模型中发现的偏差相似。本文探讨了大型分割基础模型的公平困境。我们预先策划了一个基准数据集,包括来自1056名健康受试者的3D MRI和CT扫描的器官,包括肝脏、肾脏、脾脏、肺和主动脉,并提供了每个受试者的人口统计学详细信息,如性别、年龄和身体质量指数(BMI),以便进行细致的公平性分析。我们测试了医学图像分割的最先进的基础模型,包括原始的SAM、医学SAM和SAT模型,以评估不同人口统计学群体之间的分割效果并确定差异。我们的综合分析考虑了各种混淆因素,揭示了这些基础模型中存在重大的公平性问题。此外,我们的发现不仅突显了整体分割指标(如Dice相似系数)的差异,还显示了分割错误的空间分布的显著变化,为确保医学图像分割的公平性提供了实证证据。
  • 图表
  • 解决问题
    本论文旨在探讨大型分割基础模型的公平性问题,特别是在医学图像领域中的应用。作者认为当前医学图像分割领域的研究主要关注整体准确性和效率,而忽略了公平性问题,因此需要进一步研究和验证。
  • 关键思路
    本论文提出了一个基于性别、年龄和体重指数等因素的公平性分析框架,通过对基础分割模型在不同人口群体中的性能进行评估,揭示了这些模型中存在的公平性问题。同时,本论文还通过分析分割误差的空间分布等方面,深入探讨了公平性问题的复杂性。
  • 其它亮点
    本论文使用1056个健康人士的3D MRI和CT扫描数据,包括肝脏、肾脏、脾脏、肺和主动脉等器官的专家分割。通过使用SAM、medical SAM和SAT等最先进的医学图像分割基础模型,评估了不同人口群体中的分割效果,发现了显著的公平性问题。本论文的研究方法和结果对于进一步研究医学图像分割的公平性问题具有重要意义。
  • 相关研究
    在医学图像分割领域,近年来已经涌现出许多相关研究。例如,基于深度学习的医学图像分割算法nnU-Net,以及用于解决数据不平衡问题的类别平衡交叉熵损失函数等。此外,还有一些研究关注如何提高医学图像分割模型的效率和准确性,例如基于强化学习的自适应分割模型等。
PDF
原文
点赞 收藏 评论 分享到Link

沙发等你来抢

去评论