Knowledge-driven AI-generated data for accurate and interpretable breast ultrasound diagnoses

2024年07月23日
  • 简介
    数据驱动的深度学习模型已经显示出在乳腺超声诊断中协助放射科医师的巨大能力。然而,它们的有效性受到训练数据长尾分布的限制,这会导致在罕见情况下出现不准确的结果。在这项研究中,我们解决了长期以来改善罕见情况下诊断模型性能的挑战,使用长尾数据。具体而言,我们引入了一个名为“TAILOR”的流程,它构建了一个知识驱动的生成模型来产生定制的合成数据。生成模型使用 3,749 个病变作为源数据,可以生成数百万张乳腺超声图像,特别是针对易出现错误的罕见情况。生成的数据可以进一步用于构建诊断模型,以进行准确和可解释的诊断。在前瞻性外部评估中,我们的诊断模型在特异性方面的表现超过了九位放射科医师的平均表现 33.5%,并具有相同的敏感性,通过提供可解释的决策过程来提高他们的表现。此外,在导管内癌(DCIS)方面,我们的诊断模型在源数据中只有 34 个 DCIS 病变的情况下,大幅优于所有放射科医师。我们相信,“TAILOR”可以潜在地扩展到各种疾病和成像模式。
  • 作者讲解
  • 图表
  • 解决问题
    解决长尾数据分布对乳腺超声诊断模型准确性的影响问题,提高对罕见病例的诊断准确性。
  • 关键思路
    使用基于知识的生成模型产生针对罕见病例的合成数据,进而构建更加准确和可解释的诊断模型。
  • 其它亮点
    论文提出的TAILOR方法在乳腺超声诊断中取得了显著的性能提升,特别是在罕见病例的诊断准确性上。实验中使用了基于知识的生成模型产生的合成数据进行训练,取得了比基于真实数据的训练更好的效果。论文还提到TAILOR方法可以扩展到其他疾病和成像模态。
  • 相关研究
    最近的相关研究包括《Long-tailed recognition using deep embedding learning》和《Learning from class-imbalanced data: Review of methods and applications》。
许愿开讲
PDF
原文
点赞 收藏
向作者提问
NEW
分享到Link

提问交流

提交问题,平台邀请作者,轻松获得权威解答~

向作者提问