Retrieval-Augmented Generation for AI-Generated Content: A Survey

2024年02月29日
  • 简介
    人工智能生成内容(AIGC)的发展受到模型算法、可扩展的基础模型架构和大量高质量数据集的推动。虽然AIGC取得了显著的性能,但仍面临挑战,如难以保持最新和长尾知识,数据泄漏风险和培训和推理所需的高成本。最近,检索增强生成(RAG)作为一种范式出现,旨在解决这些挑战。特别是,RAG引入了信息检索过程,通过从可用数据存储中检索相关对象来增强AIGC的结果,从而提高准确性和鲁棒性。本文全面审查了将RAG技术集成到AIGC场景中的现有工作。我们首先根据检索器如何增强生成器对RAG基础进行分类。我们提炼各种检索器和生成器的增强方法的基本抽象。这种统一的视角包括所有RAG场景,阐明了有助于未来潜在进展的先进技术和关键技术。我们还总结了其他增强RAG方法,促进了RAG系统的有效工程和实施。然后,从另一个角度,我们调查了RAG在不同模态和任务中的实际应用,为研究人员和实践者提供了有价值的参考。此外,我们介绍了RAG的基准,讨论了当前RAG系统的局限性,并提出了未来研究的潜在方向。项目网址:https://github.com/hymie122/RAG-Survey。
  • 图表
  • 解决问题
    Retrieval-Augmented Generation (RAG)的出现旨在解决什么问题?
  • 关键思路
    RAG通过信息检索过程增强AIGC结果,提高准确性和鲁棒性。论文综述了当前将RAG技术融入AIGC场景的相关工作,并提出了统一的思路框架。
  • 其它亮点
    论文对RAG的基础进行了分类,并总结了各种信息检索和生成方法的基本抽象。此外,论文还介绍了RAG的其他增强方法和实际应用,提供了有价值的参考。论文还讨论了RAG的限制和未来研究方向。
  • 相关研究
    最近的相关研究包括:《A Comprehensive Survey on Graph Neural Networks》、《Deep Learning for Video Classification: A Survey》、《A Survey of Deep Learning for Scientific Discovery》等。
PDF
原文
点赞 收藏 评论 分享到Link

沙发等你来抢

去评论