Predicting Generalization of AI Colonoscopy Models to Unseen Data

2024年03月14日
  • 简介
    $\textbf{背景}$:AI结肠镜算法的泛化能力对于在临床实践中更广泛的应用至关重要。然而,目前评估未见数据性能的技术需要昂贵和耗时的标签。 $\textbf{方法}$:我们使用“掩蔽连体网络”(MSN)来识别未见数据中的新现象并预测息肉探测器的性能。MSN被训练来预测掩蔽掉息肉图像的区域,而没有任何标签。我们测试了MSN只使用以色列的数据来训练,并在来自日本的结肠镜上检测未见技术,窄带成像(NBI)和染色内窥镜(CE)。我们还测试了MSN的能力,即使没有从日本的数据中训练,也可以预测来自两个国家的结肠镜的息肉计算机辅助检测(CADe)的性能。 $\textbf{结果}$:MSN使用无标签的Frechet距离正确地将NBI和CE识别为与以色列白光不太相似,而与日本白光相似(自助法z检验,|z|>496,p<10^-8)。MSN以99%的准确率检测NBI,在只使用白光训练的情况下比我们的启发式(90%与79%的准确率)更好地预测CE,并且是唯一能够抵抗噪声标签的方法。MSN预测在域内的以色列和域外的日本结肠镜上的CADe息肉检测器性能(r=0.79,0.37)。在训练日本检测器性能的示例很少的情况下,MSN对日本性能的预测有所提高(r=0.56)。 $\textbf{结论}$:我们的技术可以识别临床数据中的分布变化,并且可以在没有标签的情况下预测CADe检测器在未见数据上的性能。我们的自监督方法可以帮助检测实践中的数据是否与训练不同,例如在医院之间或数据从训练中有意义地转移。MSN在结肠镜之外的医学图像领域具有应用潜力。
  • 图表
  • 解决问题
    使用Masked Siamese Network(MSN)来解决AI结肠镜算法的泛化问题,即如何在没有标签的情况下评估算法在未知数据上的性能。
  • 关键思路
    通过训练MSN来预测未知数据中的新现象和息肉检测器性能,并使用自监督学习的方法来检测临床数据的分布变化。
  • 其它亮点
    论文使用自监督学习的方法来训练MSN,不需要标签。在测试中,MSN成功检测到来自不同国家的结肠镜上使用的不同技术,并且能够预测CADe息肉检测器在未知数据上的性能。此外,MSN还对噪声标签具有鲁棒性。
  • 相关研究
    与该研究相关的其他研究包括使用迁移学习和领域自适应方法来解决结肠镜算法的泛化问题,如“Cross-Domain Polyp Detection and Segmentation via Domain Adaptation: A Mixture of Experts Approach”和“Domain Adaptation for Polyp Detection with Self-Supervised Learning”。
PDF
原文
点赞 收藏 评论 分享到Link

沙发等你来抢

去评论