Memory-efficient High-resolution OCT Volume Synthesis with Cascaded Amortized Latent Diffusion Models

2024年05月26日
  • 简介
    光学相干断层扫描(OCT)图像分析在眼科领域中扮演着重要角色。目前成功的分析模型依赖于可用的大型数据集,对于某些任务而言,这些数据集的获取可能具有挑战性。使用深度生成模型创建逼真数据是一种有前途的方法。然而,由于硬件资源的限制,合成高分辨率OCT体积仍然具有困难。本文介绍了一种级联分期摊销潜在扩散模型(CA-LDM),可以以节省内存的方式合成高分辨率OCT体积。首先,我们提出了非整体自编码器,以有效地构建高分辨率体积空间和低分辨率潜在空间之间的双向映射。与自编码器一起,我们提出了级联扩散过程,通过全局到局部的精细化过程合成高分辨率OCT体积,摊销内存和计算需求。在公共高分辨率OCT数据集上的实验表明,我们的合成数据具有逼真的高分辨率和全局特征,超过了现有方法的能力。此外,两个下游细粒度分割任务的性能提高证明了所提出方法在医学图像任务的深度学习模型训练中的益处。代码公开可用:https://github.com/nicetomeetu21/CA-LDM。
  • 图表
  • 解决问题
    论文旨在通过使用深度生成模型来合成高分辨率的眼科OCT图像,以解决在某些任务中获取大规模数据集的挑战。
  • 关键思路
    论文提出了一种级联的分摊潜在扩散模型(CA-LDM),通过非整体自编码器和级联扩散过程来实现高分辨率OCT图像的合成,从而缓解了内存和计算需求。
  • 其它亮点
    论文使用公共高分辨率OCT数据集进行实验,证明了合成数据具有逼真的高分辨率和全局特征,超越了现有方法的能力。此外,在两个下游细粒度分割任务中的性能提升表明了所提出方法在医学成像任务的深度学习模型训练中的好处。论文提供了开源代码。
  • 相关研究
    最近的相关研究包括“Synthetic Medical Image Generation Using Deep Learning: A Review”和“Deep Learning for Medical Image Synthesis: A Review”。
PDF
原文
点赞 收藏 评论 分享到Link

沙发等你来抢

去评论