AIGIQA-20K: A Large Database for AI-Generated Image Quality Assessment

向作者提问

NEW

简介

随着人工智能生成内容（AIGC）的快速发展，人工智能生成图像（AIGI）已被广泛应用于娱乐、教育和社交媒体。然而，由于不同AIGI之间质量存在显著差异，迫切需要一些模型来始终匹配人类主观评分。为了解决这个问题，我们在NTIRE 2024上组织了一项挑战，广泛考虑了15种流行的生成模型，利用动态超参数（包括无分类器指导、迭代轮数和输出图像分辨率），并收集主观评分，综合考虑了21个主题的知觉质量和文本到图像对齐。这种方法最终创建了迄今为止最大的细粒度AIGI主观质量数据库，包括20,000个AIGI和420,000个主观评分，称为AIGIQA-20K。此外，我们在这个数据库上进行基准实验，评估了16种主流AIGI质量模型和人类感知之间的对应关系。我们预计，这个大规模的质量数据库将激发AIGI的强大质量指标，并推动AIGC视觉的发展。该数据库已在https://www.modelscope.cn/datasets/lcysyzxdxc/AIGCQA-30K-Image上发布。
作者讲解

目前尚无作者解读视频，你可点击下方【许愿开讲】按钮，许愿作者开讲~
图表
解决问题

论文旨在解决AIGI质量评估的问题，即如何建立一个模型能够准确匹配人类主观评分。这是一个新问题。
关键思路

论文通过在15个流行的生成模型上使用动态超参数（包括无分类器指导、迭代轮数和输出图像分辨率等），并综合考虑感知质量和文本到图像对齐等因素，收集了最大规模的AIGI主观质量数据库AIGIQA-20K。通过在该数据库上进行基准实验，评估了16个主流AIGI质量模型与人类感知之间的对应关系。
其它亮点

该论文的亮点在于建立了目前最大规模的AIGI主观质量数据库，并评估了多个AIGI质量模型的表现。论文使用了动态超参数来提高模型的性能，同时综合考虑了感知质量和文本到图像对齐等因素。论文开源了数据集，并提供了基准实验的代码和结果。
相关研究

近期相关研究包括： 1. Learning to Predict Image Quality with a Multi-Scale Architecture 2. GANs Trained by a Two Time-Scale Update Rule Converge to a Local Nash Equilibrium 3. A Large-Scale Study on Regularization and Normalization in GANs

许愿开讲

PDF

原文

点赞收藏

向作者提问

NEW

分享到Link

提问交流

提交问题，平台邀请作者，轻松获得权威解答～

向作者提问