Golden-Retriever: High-Fidelity Agentic Retrieval Augmented Generation for Industrial Knowledge Base

2024年07月20日
  • 简介
    本文介绍了Golden-Retriever,旨在有效地浏览广阔的工业知识库,克服传统LLM微调和RAG框架中的挑战,包括领域特定的术语和上下文解释。Golden-Retriever在文档检索之前增加了一步反思型问题增强,其中包括识别术语,根据上下文澄清其含义,并相应地增强问题。具体而言,我们的方法提取并列出输入问题中的所有术语和缩写,根据预定义的列表确定上下文,并查询术语字典以获取扩展定义和描述。这种全面的增强确保了RAG框架通过提供清晰的上下文和解决歧义来检索最相关的文档,从而显着提高了检索准确性。在一个领域特定的问答数据集上使用三个开源LLM进行评估,证明了Golden-Retriever的优越性能,为有效地整合和查询工业知识库提供了一个强大的解决方案。
  • 图表
  • 解决问题
    Golden-Retriever论文的目标是设计一个能够有效地查询工业知识库的方法,克服传统LLM fine-tuning和RAG框架中特定领域术语和上下文解释的挑战。这是否是一个新问题?
  • 关键思路
    Golden-Retriever在文档检索之前引入了反思型问题增强步骤,该步骤涉及识别行话、根据上下文澄清其含义,并相应地增强问题。这种全面的增强确保RAG框架通过提供清晰的上下文和解决歧义来检索最相关的文档,从而显着提高了检索准确性。
  • 其它亮点
    该论文使用三个开源LLMs对特定领域的问答数据集进行评估,证明了Golden-Retriever的优越性能。这篇论文提供了一个强大的解决方案,可以有效地集成和查询工业知识库。
  • 相关研究
    最近在这个领域中,还有一些相关的研究,如:BERT、RoBERTa、ALBERT等。
PDF
原文
点赞 收藏 评论 分享到Link

沙发等你来抢

去评论