- 简介Retrieval-Augmented Generation(RAG)在为LLMs提供更新和相关知识方面缓解了过时的知识或幻觉,具有很大的价值。然而,RAG在理解复杂的多跳查询和检索相关文档方面仍然存在几个困难,这需要LLMs逐步进行推理和检索。受人类推理过程的启发,人们逐步搜索所需信息,自然而然地会问LLMs能否注意到每个推理步骤中缺失的信息。在这项工作中,我们首先通过实验证实了LLMs提取信息以及了解缺失信息的能力。基于上述发现,我们提出了一种缺失信息引导的检索-提取-求解范式(MIGRES),其中我们利用缺失信息的识别生成有针对性的查询,以引导后续的知识检索。此外,我们设计了一种句子级的重新排名过滤方法,以过滤文档中的无关内容,同时利用LLMs的信息提取能力从清理后的文档中提取有用信息,从而增强了RAG的整体效力。在多个公共数据集上进行的广泛实验表明了所提出的MIGRES方法的优越性,并且分析实验证明了我们提出的模块的有效性。
-
- 图表
- 解决问题本文试图解决Retrieval-Augmented Generation (RAG)在理解复杂多跳查询和检索相关文档方面的困难,提出了Missing Information Guided Retrieve-Extraction-Solving(MIGRES)范例,以识别缺失信息并生成有针对性的查询来引导后续知识检索。
- 关键思路本文的关键思路是使用缺失信息来生成有针对性的查询,以引导后续的知识检索,同时设计了句子级的重新排序过滤方法来过滤掉无关的内容,并利用LLMs的信息提取能力从清理后的文档中提取有用信息。
- 其它亮点本文的实验结果表明,MIGRES方法具有很高的效果,同时分析实验也证明了所提出模块的有效性。本文使用了多个公共数据集进行了广泛的实验,并且设计了句子级的重新排序过滤方法来提高检索效果。本文的方法可以为RAG等领域的研究提供新思路。
- 最近的相关研究包括BERT、T5等模型在文本生成和检索方面的应用,以及一些基于知识图谱的自然语言处理方法,如KGAT和KGE等。
NEW
提问交流
提交问题,平台邀请作者,轻松获得权威解答~
向作者提问

提问交流