A Systematic Literature Review of Retrieval-Augmented Generation: Techniques, Metrics, and Challenges

2025年08月08日
  • 简介
    这篇关于检索增强生成(RAG)的研究文献系统综述,重点分析了2020年至2025年5月期间发表的被引量最高的研究。共有128篇文章符合我们的纳入标准,这些文献来自ACM数字图书馆、IEEE Xplore、Scopus、ScienceDirect以及数字书目与图书馆项目(DBLP)。RAG将神经检索器与生成式语言模型相结合,使模型输出以最新的非参数化记忆为基础,同时保留了存储在模型权重中的语义泛化能力。本研究以PRISMA 2020框架为指导,(i)根据被引次数和研究问题明确了纳入与排除标准,(ii)整理归纳了数据集、架构和评估方法,(iii)综合了关于RAG有效性与局限性的实证证据。为减轻引文滞后偏差,我们对2025年发表的文章设定了较低的引用次数门槛,以确保那些具有突破潜力但引用次数自然较少的研究也能被纳入分析。本次综述厘清了当前的研究现状,揭示了方法论上的空白,并为未来研究指明了重点方向。
  • 作者讲解
  • 图表
  • 解决问题
    论文试图解决如何通过检索增强生成(RAG)方法,将神经检索器与生成语言模型结合,从而在保持模型语义泛化能力的同时,使生成结果基于最新的非参数记忆。这个问题在生成模型领域具有重要意义,特别是在提升模型的时效性和准确性方面。虽然已有部分研究涉及RAG,但系统性地梳理其研究进展、方法和评估体系仍是一个亟需深入探讨的问题。
  • 关键思路
    论文的关键思路是采用系统性文献综述方法(基于PRISMA 2020框架),对2020年至2025年5月期间高被引的RAG相关研究进行全面分析。相较于以往综述,该论文通过动态调整2025年论文的引用门槛,缓解了“引用滞后偏差”,从而更全面地捕捉新兴突破。这种方法提升了综述的时效性和代表性。
  • 其它亮点
    1. 涵盖了来自ACM Digital Library、IEEE Xplore、Scopus、ScienceDirect和DBLP等多个权威数据库的128篇高被引论文。 2. 详细梳理了RAG在数据集、架构设计和评估方法上的研究现状。 3. 指出了当前RAG研究中的方法论空白,并提出了未来研究的优先方向。 4. 强调了RAG在结合非参数记忆与参数化模型泛化能力方面的潜力。 5. 论文未提及开源代码,但其系统性分析方法为后续研究提供了可复现的基础框架。
  • 相关研究
    1. 《Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks》 2. 《Dense Passage Retrieval for Open-Domain Question Answering》 3. 《Language Models as Knowledge Bases?》 4. 《REALM: Retrieval-Augmented Language Model Pre-Training》 5. 《KILT: A Benchmark for Keyboards in Language Tasks》
许愿开讲
PDF
原文
点赞 收藏
向作者提问
NEW
分享到Link

提问交流

提交问题,平台邀请作者,轻松获得权威解答~

向作者提问