Exploring AIGC Video Quality: A Focus on Visual Harmony, Video-Text Consistency and Domain Distribution Gap

2024年04月21日
  • 简介
    最近文本到视频人工智能生成内容(AIGC)的进展非常显著。与传统视频相比,对AIGC视频的评估遇到了各种挑战:视觉上的不一致性违反常识、内容与文本提示之间的差异以及各种生成模型之间的分布差距等。针对这些挑战,本文将AIGC视频质量评估分为三个维度:视觉协调性、视频文本一致性和领域分布差距。针对每个维度,我们设计了特定的模块,以提供全面的AIGC视频质量评估。此外,我们的研究发现,不同文本到视频模型生成的视频之间在视觉质量、流畅性和风格方面存在显著差异。预测源生成模型可以使AIGC视频特征更具有区分性,从而提高质量评估性能。所提出的方法已经在NTIRE 2024 AI生成内容质量评估-Track 2 Video的第三名获胜者中使用,证明了其有效性。
  • 作者讲解
  • 图表
  • 解决问题
    本论文旨在解决文本到视频人工智能生成内容(AIGC)的质量评估问题,包括视觉协调性、视频文本一致性和领域分布差异等方面的挑战。
  • 关键思路
    本论文通过设计特定模块,针对AIGC视频的不同维度进行全面的质量评估,并且通过预测生成模型来提高评估性能。
  • 其它亮点
    该研究发现不同文本到视频模型生成的视频在视觉质量、流畅性和风格等方面存在显著差异。论文提出的方法在NTIRE 2024 Quality Assessment for AI-Generated Content比赛中获得了第三名,证明了其有效性。
  • 相关研究
    近期的相关研究包括:1. Learning to Generate Videos with Arbitrary Temporal Lengths and Hierarchical Supervision; 2. Few-Shot Video-to-Video Synthesis; 3. Video Generation from Text: A Survey.
许愿开讲
PDF
原文
点赞 收藏
向作者提问
NEW
分享到Link

提问交流

提交问题,平台邀请作者,轻松获得权威解答~

向作者提问