论文标题:A survey on VQA_Datasets and Approaches

论文链接:https://arxiv.org/abs/2105.00421

作者单位:西交利物浦大学 & 爱荷华大学

本文全面调研和分析用于视觉问答(VQA)任务的现有数据集,指标和模型!并分讨论了目前的进展和待解决的问题。

视觉问答(VQA)是一项结合了计算机视觉和自然语言处理技术的任务。 它需要模型根据视觉中包含的信息来回答基于文本的问题。近年来,VQA的研究领域得到了扩展。 还进一步探索了以VQA为重点,研究科学图论的推理能力和VQA的研究。 同时,已经提出了更多的多模态特征融合机制。 本文调研和分析用于VQA任务的现有数据集,指标和模型。

 

内容中包含的图片若涉及版权问题,请及时与我们联系删除