之前的研究表明人工智能在诊断影像数据上有潜力,但临床应用仍然滞后。这部分是因为人工智能模型需要训练大量常见疾病的样本,而这些样本只有在临床实践中才能获得。然而,在临床实际中,只有少数疾病是常见的,而大多数疾病是不常见的(长尾分布)。当前的人工智能模型忽略或错误分类这些疾病。我们提出了一种深度异常检测方法,只需要使用常见疾病的训练数据,即可检测出所有不常见的疾病。我们收集了两个大型真实世界的胃肠活检数据集,这是该问题的原型。在这里,十个最常见的发现约占90%的病例,而其余10%包含了56种疾病实体,包括许多癌症。用于训练和评估的5423个病例的1700万个组织学图像。在没有针对这些疾病的特定训练的情况下,我们表现最佳的模型可可靠地检测到广泛的不常见(“异常”)病理,其AUROC分别为95.0%(胃)和91.0%(结肠),并且可以推广到扫描仪和医院。根据设计,所提出的异常检测可以检测到胃肠活检诊断尾部的任何病理变化,包括罕见的原发性或转移性癌症。本研究建立了基于人工智能异常检测的组织病理学的第一个有效的临床应用,可以标记异常情况,促进病例优先处理,减少漏诊,并增强人工智能模型的整体安全性,从而推动人工智能在常规诊断和其他领域的应用和自动化。
提问交流