ACL 2022 | 面向中文真实搜索场景的开放域文档视觉问答数据集

转自：哈工大SCIR

论文名称：DuReader_vis: A Chinese Dataset for Open-domain Document Visual Question Answering

论文作者：齐乐，吕尚文，李弘宇，刘璟，张宇，佘俏俏，吴华，王海峰，刘挺

原创作者：齐乐

论文链接：https://aclanthology.org/2022.findings-acl.105/

开放域问答在现实生活中有着广泛的应用，例如搜索引擎、企业问答、医疗问答等等。然而，现有开放域问答系统通常需要消耗大量成本针对不同格式的异构文档（如PDF、网页、扫描文档等）设计特定的内容抽取算法，预先从文档中抽取文本内容作为系统的信息来源。这不仅限制了现有系统的可扩展能力，还损失了文档中的布局和视觉信息。为此，本文提出了一个全新的开放域文档视觉问答任务，直接以异构文档图像集合为信息来源回答用户提问，并提出了中文开放域文档视觉问答数据集DuReader_vis。DuReader_vis共包含158K文档图像和15K对问答对，主要挑战包括：1）长文档理解；2）噪声干扰；和3）多片段答案抽取。目前数据集已开源至https://github.com/baidu/DuReader/tree/master/DuReader-vis。

内容中包含的图片若涉及版权问题，请及时与我们联系删除

ACL 2022 | 面向中文真实搜索场景的开放域文档视觉问答数据集

评论列表

评论