复杂视频中的人物检索是视频分析的重要问题,它要求从一段完整的视频中抽取出包含特定目标人物的全部出场片段。自动地针对视频内容进行有效的信息抽取和理解,从而检索出目标人物,可以更好地帮助人们快速且准确地理解视频内容。

本文工作由中国科学技术大学与华为云AI联合完成,并由华为-中科大企业智能联合创新项目资助。相关成果已被中国计算机学会推荐A类国际期刊ACM TOIS录用。

论文标题:Social Context-aware Person Search in Videos via Multi-modal Cues
期刊名称: ACM Transactions on Information Systems
本文提出的多模态人物检索模型主要包括:人物特征提取步骤、场景分割步骤、图建模步骤,以及关系感知的特征聚合步骤

内容中包含的图片若涉及版权问题,请及时与我们联系删除