Fairness Evolution in Continual Learning for Medical Imaging

2024年04月10日
  • 简介
    近年来,深度学习在各种医疗应用中取得了显著进展,取得了令人瞩目的成果。在医学影像领域,深度学习模型可以通过对胸部X射线图像中的病理分类来帮助医生诊断疾病。然而,训练新数据以扩展模型能力并适应分布变化是这些模型面临的显著挑战。连续学习已经成为解决这一挑战的方法,使模型能够适应新数据,同时保留从以前的经验中获得的知识。以前的研究已经分析了医学影像中CL策略的行为,关于分类性能。然而,当考虑到与敏感信息交互的模型时,例如在医学领域,必须分离社会显著群体的表现。的确,深度学习算法可能对某些亚人群表现出偏见,导致在不同由敏感属性(如年龄、种族/族裔、性别/性别和社会经济地位)识别的群体之间存在预测性能上的差异。在本研究中,我们超越了对CL中分类性能的典型评估,并使用特定领域的公平度量来研究偏差随任务的演变。具体而言,我们评估了Replay、LwF、LwF Replay和Pseudo-Label策略,使用著名的CheXpert(CXP)和ChestX-ray14(NIH)数据集。我们考虑了五个任务的类增量场景,涉及12种病理。LwF和Pseudo-Label表现出最佳的分类性能,但是当在评估中包括公平度量时,显然Pseudo-Label的偏差较小。因此,在考虑模型的公平性至关重要的实际场景中,应该首选这种策略。
  • 图表
  • 解决问题
    解决问题:论文旨在解决医学图像中深度学习模型在处理新数据时的挑战,即如何在保留之前学习知识的同时,适应新数据的分布变化。同时,论文还考虑到了敏感信息对模型的影响,探讨了如何在保证分类性能的同时保持公平性。
  • 关键思路
    关键思路:论文提出了多种连续学习策略,针对五个任务的12种病理学进行了实验评估。在评估分类性能的同时,使用领域特定的公平度量指标来评估模型的公平性。结果表明,Pseudo-Label策略在保持分类性能的同时,具有更少的偏差,因此在考虑模型公平性的情况下应优先考虑该策略。
  • 其它亮点
    其他亮点:实验使用了CheXpert和ChestX-ray14数据集,并开源了代码。在评估公平性时,使用了领域特定的公平度量指标,包括均衡性、平均准确性差异和统计差异。论文还探讨了深度学习算法对不同人群的偏见,提出了在实际应用中考虑模型公平性的重要性。
  • 相关研究
    相关研究:最近在这个领域中,也有研究探讨了连续学习策略在医学图像中的应用。例如,一篇题为“Continual Learning for Medical Image Classification: A Comparative Study”的论文比较了几种连续学习策略在医学图像分类任务中的性能。另外,也有研究探讨深度学习算法中的公平性问题,例如“Mitigating Bias in Deep Learning for Automatic Diagnosis”。
PDF
原文
点赞 收藏 评论 分享到Link

沙发等你来抢

去评论