Golden-Retriever: High-Fidelity Agentic Retrieval Augmented Generation for Industrial Knowledge Base

简介

本文介绍了Golden-Retriever，旨在有效地浏览广阔的工业知识库，克服传统LLM微调和RAG框架中的挑战，包括领域特定的术语和上下文解释。Golden-Retriever在文档检索之前增加了一步反思型问题增强，其中包括识别术语，根据上下文澄清其含义，并相应地增强问题。具体而言，我们的方法提取并列出输入问题中的所有术语和缩写，根据预定义的列表确定上下文，并查询术语字典以获取扩展定义和描述。这种全面的增强确保了RAG框架通过提供清晰的上下文和解决歧义来检索最相关的文档，从而显着提高了检索准确性。在一个领域特定的问答数据集上使用三个开源LLM进行评估，证明了Golden-Retriever的优越性能，为有效地整合和查询工业知识库提供了一个强大的解决方案。
图表
解决问题

Golden-Retriever论文的目标是设计一个能够有效地查询工业知识库的方法，克服传统LLM fine-tuning和RAG框架中特定领域术语和上下文解释的挑战。这是否是一个新问题？
关键思路

Golden-Retriever在文档检索之前引入了反思型问题增强步骤，该步骤涉及识别行话、根据上下文澄清其含义，并相应地增强问题。这种全面的增强确保RAG框架通过提供清晰的上下文和解决歧义来检索最相关的文档，从而显着提高了检索准确性。
其它亮点

该论文使用三个开源LLMs对特定领域的问答数据集进行评估，证明了Golden-Retriever的优越性能。这篇论文提供了一个强大的解决方案，可以有效地集成和查询工业知识库。
相关研究

最近在这个领域中，还有一些相关的研究，如：BERT、RoBERTa、ALBERT等。

Golden-Retriever: High-Fidelity Agentic Retrieval Augmented Generation for Industrial Knowledge Base

评论