AIGIQA-20K: A Large Database for AI-Generated Image Quality Assessment

2024年04月04日
  • 简介
    随着人工智能生成内容(AIGC)的快速发展,人工智能生成图像(AIGI)已被广泛应用于娱乐、教育和社交媒体。然而,由于不同AIGI之间质量存在显著差异,迫切需要一些模型来始终匹配人类主观评分。为了解决这个问题,我们在NTIRE 2024上组织了一项挑战,广泛考虑了15种流行的生成模型,利用动态超参数(包括无分类器指导、迭代轮数和输出图像分辨率),并收集主观评分,综合考虑了21个主题的知觉质量和文本到图像对齐。这种方法最终创建了迄今为止最大的细粒度AIGI主观质量数据库,包括20,000个AIGI和420,000个主观评分,称为AIGIQA-20K。此外,我们在这个数据库上进行基准实验,评估了16种主流AIGI质量模型和人类感知之间的对应关系。我们预计,这个大规模的质量数据库将激发AIGI的强大质量指标,并推动AIGC视觉的发展。该数据库已在https://www.modelscope.cn/datasets/lcysyzxdxc/AIGCQA-30K-Image上发布。
  • 作者讲解
  • 图表
  • 解决问题
    论文旨在解决AIGI质量评估的问题,即如何建立一个模型能够准确匹配人类主观评分。这是一个新问题。
  • 关键思路
    论文通过在15个流行的生成模型上使用动态超参数(包括无分类器指导、迭代轮数和输出图像分辨率等),并综合考虑感知质量和文本到图像对齐等因素,收集了最大规模的AIGI主观质量数据库AIGIQA-20K。通过在该数据库上进行基准实验,评估了16个主流AIGI质量模型与人类感知之间的对应关系。
  • 其它亮点
    该论文的亮点在于建立了目前最大规模的AIGI主观质量数据库,并评估了多个AIGI质量模型的表现。论文使用了动态超参数来提高模型的性能,同时综合考虑了感知质量和文本到图像对齐等因素。论文开源了数据集,并提供了基准实验的代码和结果。
  • 相关研究
    近期相关研究包括: 1. Learning to Predict Image Quality with a Multi-Scale Architecture 2. GANs Trained by a Two Time-Scale Update Rule Converge to a Local Nash Equilibrium 3. A Large-Scale Study on Regularization and Normalization in GANs
许愿开讲
PDF
原文
点赞 收藏
向作者提问
NEW
分享到Link

提问交流

提交问题,平台邀请作者,轻松获得权威解答~

向作者提问