- 简介人工智能(AI)基于图像分析在支持诊断组织病理学,包括癌症诊断方面具有巨大的潜力。然而,开发有监督的AI方法需要大规模的注释数据集。一种潜在的强大解决方案是使用合成数据增强训练数据。潜在扩散模型可以生成高质量、多样化的合成图像,具有很大的潜力。然而,最常见的实现依赖于详细的文本描述,而这在这个领域通常不可用。本文提出了一种方法,从自动提取的图像特征构建结构化的文本提示。我们使用PCam数据集进行实验,该数据集仅由松散注释为健康或癌症的组织补丁组成。我们展示了将图像派生特征包含在提示中,而不是仅包含健康和癌症标签,可以将Fr\'echet Inception Distance(FID)从178.8提高到90.2。我们还展示了病理学家发现检测合成图像具有挑战性,中位敏感性/特异性为0.55 / 0.55。最后,我们展示了合成数据有效地训练AI模型。
-
- 图表
- 解决问题本论文的问题是如何使用合成数据来帮助训练基于人工智能的肿瘤病理学诊断模型。由于需要大规模的注释数据集,因此需要一种方法来使用合成数据来增强训练数据。同时,如何从图像特征中构建结构化文本提示也是一个问题。
- 关键思路本文提出了一种使用从图像特征中提取的信息构建结构化文本提示的方法,以生成高质量的合成图像。与只使用健康和癌症标签相比,使用图像派生的特征来构建提示可以提高模型的FID值。
- 其它亮点本文的实验使用了PCam数据集,该数据集由松散标注的健康和癌症组成。实验结果表明,使用图像派生的特征来构建提示可以提高模型的FID值。此外,病理学家难以检测合成图像,证明了合成图像的质量。最后,合成数据有效地训练了人工智能模型。
- 在相关研究方面,最近的一些研究包括使用深度学习方法进行癌症诊断和使用合成数据进行图像分类。其中一些论文包括:“Deep learning for digital pathology image analysis: A comprehensive tutorial with selected use cases”和“Synthetic data for deep learning: a review”。
NEW
提问交流
提交问题,平台邀请作者,轻松获得权威解答~
向作者提问

提问交流