GenzIQA: Generalized Image Quality Assessment using Prompt-Guided Latent Diffusion Models

简介

无参考（NR）图像质量评估（IQA）算法的设计对于现代视觉系统中的用户体验基准和校准非常重要。目前最先进的NR-IQA方法的一个主要缺点是它们在合理的分布偏移下跨越不同IQA设置的能力有限。最近的文本到图像生成模型，如潜在扩散模型，生成与文本概念相关的具有细节的有意义的视觉概念。在这项工作中，我们利用这种扩散模型的去噪过程来理解可学习的质量感知文本提示与图像之间的对齐程度，从而实现广义IQA。特别地，我们从潜在扩散模型的去噪器的中间层中学习交叉注意力映射，以捕获图像的质量感知表示。此外，我们还引入了可学习的质量感知文本提示，使交叉注意力特征更具质量感知性。我们在各种基于用户生成、合成和低光内容的基准数据库上进行了广泛的交叉数据库实验，结果显示潜在扩散模型相对于文献中的其他方法可以在IQA的广义性方面取得更好的表现。
作者讲解

目前尚无作者解读视频，你可点击下方【许愿开讲】按钮，许愿作者开讲~
图表
解决问题

本文旨在解决现有无参考图像质量评估算法在不同评估设置下泛化能力有限的问题。作者提出了一种基于潜在扩散模型的通用图像质量评估方法。
关键思路

本文的关键思路是利用潜在扩散模型的去噪过程，通过学习可学习的质量感知文本提示与图像之间的对齐程度来实现通用图像质量评估。
其它亮点

本文通过在各种用户生成、合成和低光内容的基准数据库上进行广泛的交叉实验，展示了潜在扩散模型在图像质量评估中具有优越的泛化性能。本文的亮点包括使用潜在扩散模型进行通用图像质量评估，引入可学习的质量感知文本提示，以及跨数据库实验的结果。
相关研究

最近在这个领域中，还有一些相关的研究，例如：《A Comprehensive Survey of Deep Learning for Image Quality Assessment》、《Deep Blind Image Quality Assessment: A Survey》等。

GenzIQA: Generalized Image Quality Assessment using Prompt-Guided Latent Diffusion Models

提问交流

提问交流