Hierarchical Retrieval-Augmented Generation Model with Rethink for Multi-hop Question Answering

简介

多跳问题回答（QA）需要通过整合多个信息片段来解决复杂问题，需要进行复杂的推理。然而，现有的QA系统面临着过时信息、上下文窗口长度限制和准确性-数量权衡等挑战。为了解决这些问题，我们提出了一个新的框架，称为具有重新思考的分层检索增强生成模型（HiRAG），包括分解器、定义器、检索器、过滤器和摘要器五个关键模块。我们引入了一种新的分层检索策略，将文档级别的稀疏检索和块级别的密集检索有效地整合起来，充分发挥它们的优势。此外，我们提出了一种单候选检索方法，以缓解多候选检索的局限性。我们还构建了两个新的语料库，Indexed Wikicorpus和Profile Wikicorpus，以解决过时和知识不足的问题。我们在四个数据集上的实验结果表明，HiRAG在大多数指标上优于最先进的模型，我们的Indexed Wikicorpus是有效的。HiRAG的代码可在https://github.com/2282588541a/HiRAG上获得。
作者讲解

目前尚无作者解读视频，你可点击下方【许愿开讲】按钮，许愿作者开讲~
图表
解决问题

本论文旨在解决多跳问答中存在的问题，如过时信息、上下文窗口长度限制和准确性-数量权衡等，提出了一个新的框架HiRAG。
关键思路

HiRAG框架包含五个关键模块，其中引入了一种新的分层检索策略，同时结合了稀疏检索和密集检索的优势，提出了单候选检索方法来减轻多候选检索的限制。此外，构建了两个新的语料库来解决知识过时和不足的问题。
其它亮点

实验结果表明，HiRAG在四个数据集上表现优于现有的模型，并且构建的Indexed Wikicorpus是有效的。HiRAG的代码已经开源。
相关研究

近期在这个领域中，还有一些相关的研究，如《Multi-hop Reading Comprehension through Question Decomposition and Rescoring》、《Multi-hop Knowledge Reasoning for Non-factoid Answer Generation》等。

Hierarchical Retrieval-Augmented Generation Model with Rethink for Multi-hop Question Answering

提问交流

提问交流