Is Table Retrieval a Solved Problem? Exploring Join-Aware Multi-Table Retrieval

2024年04月15日
  • 简介
    检索包含必要信息以准确回答给定问题的相关表格对于开放领域问答(QA)系统至关重要。以前的方法假设此类问题的答案可以在单个表格或通过问题分解或改写识别出的多个表格中找到。然而,这两种方法都不足够,因为许多问题需要检索多个表格,并通过连接计划将它们连接起来,这个连接计划无法从用户查询本身中确定。如果在检索阶段不考虑连接计划,则基于这些检索到的表格进行推理和回答的后续步骤很可能是错误的。为了解决这个问题,我们介绍了一种方法,在表格检索期间揭示任何查询和数据库的有用连接关系。我们使用一种新颖的重新排序方法,该方法被制定为混合整数程序,不仅考虑表格-查询相关性,还考虑需要推断连接关系的表格-表格相关性。我们的方法在表格检索方面的性能优于现有技术水平,F1得分最高可达9.3%,在端到端QA方面的准确性最高可提高5.4%。
  • 作者讲解
  • 图表
  • 解决问题
    本论文旨在解决开放域问答系统中表格检索的问题,特别是在需要检索多个表格并通过连接计划进行连接的情况下。
  • 关键思路
    本文提出了一种新的方法,在表格检索过程中考虑连接关系,通过混合整数规划的重新排序方法,不仅考虑了表格与查询的相关性,还考虑了需要推断连接关系的表格与表格之间的相关性。
  • 其它亮点
    该方法在表格检索和端到端问答方面的性能都优于现有的最先进方法,F1得分提高了9.3%,准确性提高了5.4%。实验使用了多个数据集,并开源了代码。
  • 相关研究
    最近的相关研究包括《TabFact: A Large-scale Dataset for Table-based Fact Verification》和《WikiTableQuestions: a high-stakes dataset for tabular reasoning》。
许愿开讲
PDF
原文
点赞 收藏
向作者提问
NEW
分享到Link

提问交流

提交问题,平台邀请作者,轻松获得权威解答~

向作者提问