Exploring AIGC Video Quality: A Focus on Visual Harmony, Video-Text Consistency and Domain Distribution Gap

简介

最近文本到视频人工智能生成内容（AIGC）的进展非常显著。与传统视频相比，对AIGC视频的评估遇到了各种挑战：视觉上的不一致性违反常识、内容与文本提示之间的差异以及各种生成模型之间的分布差距等。针对这些挑战，本文将AIGC视频质量评估分为三个维度：视觉协调性、视频文本一致性和领域分布差距。针对每个维度，我们设计了特定的模块，以提供全面的AIGC视频质量评估。此外，我们的研究发现，不同文本到视频模型生成的视频之间在视觉质量、流畅性和风格方面存在显著差异。预测源生成模型可以使AIGC视频特征更具有区分性，从而提高质量评估性能。所提出的方法已经在NTIRE 2024 AI生成内容质量评估-Track 2 Video的第三名获胜者中使用，证明了其有效性。
作者讲解

目前尚无作者解读视频，你可点击下方【许愿开讲】按钮，许愿作者开讲~
图表
解决问题

本论文旨在解决文本到视频人工智能生成内容（AIGC）的质量评估问题，包括视觉协调性、视频文本一致性和领域分布差异等方面的挑战。
关键思路

本论文通过设计特定模块，针对AIGC视频的不同维度进行全面的质量评估，并且通过预测生成模型来提高评估性能。
其它亮点

该研究发现不同文本到视频模型生成的视频在视觉质量、流畅性和风格等方面存在显著差异。论文提出的方法在NTIRE 2024 Quality Assessment for AI-Generated Content比赛中获得了第三名，证明了其有效性。
相关研究

近期的相关研究包括：1. Learning to Generate Videos with Arbitrary Temporal Lengths and Hierarchical Supervision; 2. Few-Shot Video-to-Video Synthesis; 3. Video Generation from Text: A Survey.

Exploring AIGC Video Quality: A Focus on Visual Harmony, Video-Text Consistency and Domain Distribution Gap

提问交流

提问交流