论文标题:A survey on VQA_Datasets and Approaches
论文链接:https://arxiv.org/abs/2105.00421
作者单位:西交利物浦大学 & 爱荷华大学
本文全面调研和分析用于视觉问答(VQA)任务的现有数据集,指标和模型!并分讨论了目前的进展和待解决的问题。
视觉问答(VQA)是一项结合了计算机视觉和自然语言处理技术的任务。 它需要模型根据视觉中包含的信息来回答基于文本的问题。近年来,VQA的研究领域得到了扩展。 还进一步探索了以VQA为重点,研究科学图论的推理能力和VQA的研究。 同时,已经提出了更多的多模态特征融合机制。 本文调研和分析用于VQA任务的现有数据集,指标和模型。
内容中包含的图片若涉及版权问题,请及时与我们联系删除
评论
沙发等你来抢