Accelerating Diffusion for SAR-to-Optical Image Translation via Adversarial Consistency Distillation

2024年07月08日
  • 简介
    合成孔径雷达(SAR)提供全天候、高分辨率成像能力,但其独特的成像机制通常需要专业人员进行解释,限制了其广泛应用。使用扩散模型将SAR图像转换为更易于识别的光学图像有助于解决这一挑战。然而,由于众多迭代推断,扩散模型存在高延迟的问题,而生成对抗网络(GAN)可以通过单次迭代实现图像转换,但往往以图像质量为代价。为了解决这些问题,我们提出了一种新的SAR到光学图像转换训练框架,结合了两种方法的优点。我们的方法采用一致性蒸馏来减少迭代推理步骤,并集成了对抗学习来确保图像清晰度和最小化色彩偏移。此外,我们的方法允许在质量和速度之间进行权衡,根据应用要求提供灵活性。我们在SEN12和GF3数据集上进行了实验,使用峰值信噪比(PSNR)、结构相似性指数(SSIM)和Frechet Inception距离(FID)进行定量评估,同时计算推理延迟。结果表明,我们的方法将推理速度提高了131倍,同时保持了生成图像的视觉质量,因此为SAR到光学图像转换提供了强大而高效的解决方案。
  • 作者讲解
  • 图表
  • 解决问题
    论文旨在解决SAR图像转光学图像的问题,通过结合扩散模型和生成对抗网络的优势,提高图像转换的速度和质量。
  • 关键思路
    论文提出了一种新的训练框架,结合了一致性蒸馏和对抗学习的方法,以降低迭代推理步骤并确保图像清晰度和最小化颜色偏移,同时允许根据应用需求在质量和速度之间进行权衡。
  • 其它亮点
    实验使用SEN12和GF3数据集,通过PSNR、SSIM和FID等指标进行了定量评估,并计算了推理延迟。结果表明,该方法在保持生成图像视觉质量的同时,将推理速度提高了131倍,从而为SAR到光学图像转换提供了一种强大而高效的解决方案。
  • 相关研究
    近期的相关研究包括:'Dual-Branch Generative Adversarial Network for Simultaneous Infrared and Visible Image Fusion'、'SAR Image Despeckling via Multi-Scale and Multi-Feature Non-Local Attention Network'等。
许愿开讲
PDF
原文
点赞 收藏
向作者提问
NEW
分享到Link

提问交流

提交问题,平台邀请作者,轻松获得权威解答~

向作者提问