- 简介多跳问题回答(QA)需要通过整合多个信息片段来解决复杂问题,需要进行复杂的推理。然而,现有的QA系统面临着过时信息、上下文窗口长度限制和准确性-数量权衡等挑战。为了解决这些问题,我们提出了一个新的框架,称为具有重新思考的分层检索增强生成模型(HiRAG),包括分解器、定义器、检索器、过滤器和摘要器五个关键模块。我们引入了一种新的分层检索策略,将文档级别的稀疏检索和块级别的密集检索有效地整合起来,充分发挥它们的优势。此外,我们提出了一种单候选检索方法,以缓解多候选检索的局限性。我们还构建了两个新的语料库,Indexed Wikicorpus和Profile Wikicorpus,以解决过时和知识不足的问题。 我们在四个数据集上的实验结果表明,HiRAG在大多数指标上优于最先进的模型,我们的Indexed Wikicorpus是有效的。HiRAG的代码可在https://github.com/2282588541a/HiRAG上获得。
-
- 图表
- 解决问题本论文旨在解决多跳问答中存在的问题,如过时信息、上下文窗口长度限制和准确性-数量权衡等,提出了一个新的框架HiRAG。
- 关键思路HiRAG框架包含五个关键模块,其中引入了一种新的分层检索策略,同时结合了稀疏检索和密集检索的优势,提出了单候选检索方法来减轻多候选检索的限制。此外,构建了两个新的语料库来解决知识过时和不足的问题。
- 其它亮点实验结果表明,HiRAG在四个数据集上表现优于现有的模型,并且构建的Indexed Wikicorpus是有效的。HiRAG的代码已经开源。
- 近期在这个领域中,还有一些相关的研究,如《Multi-hop Reading Comprehension through Question Decomposition and Rescoring》、《Multi-hop Knowledge Reasoning for Non-factoid Answer Generation》等。
NEW
提问交流
提交问题,平台邀请作者,轻松获得权威解答~
向作者提问

提问交流