LightPAL: Lightweight Passage Retrieval for Open Domain Multi-Document Summarization

2024年06月18日
  • 简介
    开放领域多文档摘要(ODMDS)对于解决各种信息需求至关重要,它旨在从大量文献中综合相关内容,生成回答用户查询的摘要。现有的方法首先找到相关段落,然后使用语言模型生成摘要,但对于ODMDS来说是不够的。这是因为开放式查询通常需要检索到更多的上下文,才能全面覆盖主题,使得最初检索到的所有相关段落具有挑战性。虽然已经探索了迭代检索方法用于多跳问题回答(MQA),但由于重复的大型语言模型(LLM)推理导致的高延迟使其在ODMDS中不切实际。为了解决这个问题,我们提出了LightPAL,一种用于ODMDS的轻量级段落检索方法,它在索引期间使用LLM构建表示段落关系的图,并在推理时采用随机游走而不是迭代推理和检索。在ODMDS基准测试中的实验表明,LightPAL在摘要质量方面优于基线检索器,同时比迭代MQA方法更高效。
  • 作者讲解
  • 图表
  • 解决问题
    本论文旨在解决开放领域多文档摘要(ODMDS)的问题,即如何从大量文档中综合相关内容生成摘要,现有方法无法满足开放式查询的需求,需要更多上下文信息来综合覆盖主题。
  • 关键思路
    本文提出了一种轻量级的文本段落检索方法LightPAL,通过在索引期间使用LLM构建表示段落关系的图,并在推理时使用随机游走代替迭代推理和检索,从而提高了检索效率和摘要质量。
  • 其它亮点
    实验表明,LightPAL在摘要质量方面优于基线检索器,同时比迭代MQA方法更高效。
  • 相关研究
    在这个领域中,最近的相关研究包括Multi-Document Summarization Using Cluster-based Link Analysis和Multi-Document Summarization Using Improved Semantic Representations等。
许愿开讲
PDF
原文
点赞 收藏
向作者提问
NEW
分享到Link

提问交流

提交问题,平台邀请作者,轻松获得权威解答~

向作者提问