LLMs Know What They Need: Leveraging a Missing Information Guided Framework to Empower Retrieval-Augmented Generation

向作者提问

NEW

简介

Retrieval-Augmented Generation（RAG）在为LLMs提供更新和相关知识方面缓解了过时的知识或幻觉，具有很大的价值。然而，RAG在理解复杂的多跳查询和检索相关文档方面仍然存在几个困难，这需要LLMs逐步进行推理和检索。受人类推理过程的启发，人们逐步搜索所需信息，自然而然地会问LLMs能否注意到每个推理步骤中缺失的信息。在这项工作中，我们首先通过实验证实了LLMs提取信息以及了解缺失信息的能力。基于上述发现，我们提出了一种缺失信息引导的检索-提取-求解范式（MIGRES），其中我们利用缺失信息的识别生成有针对性的查询，以引导后续的知识检索。此外，我们设计了一种句子级的重新排名过滤方法，以过滤文档中的无关内容，同时利用LLMs的信息提取能力从清理后的文档中提取有用信息，从而增强了RAG的整体效力。在多个公共数据集上进行的广泛实验表明了所提出的MIGRES方法的优越性，并且分析实验证明了我们提出的模块的有效性。
作者讲解

目前尚无作者解读视频，你可点击下方【许愿开讲】按钮，许愿作者开讲~
图表
解决问题

本文试图解决Retrieval-Augmented Generation (RAG)在理解复杂多跳查询和检索相关文档方面的困难，提出了Missing Information Guided Retrieve-Extraction-Solving（MIGRES）范例，以识别缺失信息并生成有针对性的查询来引导后续知识检索。
关键思路

本文的关键思路是使用缺失信息来生成有针对性的查询，以引导后续的知识检索，同时设计了句子级的重新排序过滤方法来过滤掉无关的内容，并利用LLMs的信息提取能力从清理后的文档中提取有用信息。
其它亮点

本文的实验结果表明，MIGRES方法具有很高的效果，同时分析实验也证明了所提出模块的有效性。本文使用了多个公共数据集进行了广泛的实验，并且设计了句子级的重新排序过滤方法来提高检索效果。本文的方法可以为RAG等领域的研究提供新思路。
相关研究

最近的相关研究包括BERT、T5等模型在文本生成和检索方面的应用，以及一些基于知识图谱的自然语言处理方法，如KGAT和KGE等。

许愿开讲

PDF

原文

点赞收藏

向作者提问

NEW

分享到Link

提问交流

提交问题，平台邀请作者，轻松获得权威解答～

向作者提问