Accelerating Diffusion for SAR-to-Optical Image Translation via Adversarial Consistency Distillation

简介

合成孔径雷达（SAR）提供全天候、高分辨率成像能力，但其独特的成像机制通常需要专业人员进行解释，限制了其广泛应用。使用扩散模型将SAR图像转换为更易于识别的光学图像有助于解决这一挑战。然而，由于众多迭代推断，扩散模型存在高延迟的问题，而生成对抗网络（GAN）可以通过单次迭代实现图像转换，但往往以图像质量为代价。为了解决这些问题，我们提出了一种新的SAR到光学图像转换训练框架，结合了两种方法的优点。我们的方法采用一致性蒸馏来减少迭代推理步骤，并集成了对抗学习来确保图像清晰度和最小化色彩偏移。此外，我们的方法允许在质量和速度之间进行权衡，根据应用要求提供灵活性。我们在SEN12和GF3数据集上进行了实验，使用峰值信噪比（PSNR）、结构相似性指数（SSIM）和Frechet Inception距离（FID）进行定量评估，同时计算推理延迟。结果表明，我们的方法将推理速度提高了131倍，同时保持了生成图像的视觉质量，因此为SAR到光学图像转换提供了强大而高效的解决方案。
作者讲解

目前尚无作者解读视频，你可点击下方【许愿开讲】按钮，许愿作者开讲~
图表
解决问题

论文旨在解决SAR图像转光学图像的问题，通过结合扩散模型和生成对抗网络的优势，提高图像转换的速度和质量。
关键思路

论文提出了一种新的训练框架，结合了一致性蒸馏和对抗学习的方法，以降低迭代推理步骤并确保图像清晰度和最小化颜色偏移，同时允许根据应用需求在质量和速度之间进行权衡。
其它亮点

实验使用SEN12和GF3数据集，通过PSNR、SSIM和FID等指标进行了定量评估，并计算了推理延迟。结果表明，该方法在保持生成图像视觉质量的同时，将推理速度提高了131倍，从而为SAR到光学图像转换提供了一种强大而高效的解决方案。
相关研究

近期的相关研究包括：'Dual-Branch Generative Adversarial Network for Simultaneous Infrared and Visible Image Fusion'、'SAR Image Despeckling via Multi-Scale and Multi-Feature Non-Local Attention Network'等。

Accelerating Diffusion for SAR-to-Optical Image Translation via Adversarial Consistency Distillation

提问交流

提问交流