主动检索增强生成

解决问题：该论文试图解决语言模型在生成文本时会产生错误信息的问题，提出了一种从外部知识资源检索信息的方法。同时，该论文还提出了一种新的检索增强模型，能够在生成长文本时持续检索信息，提高生成文本的准确性。

关键思路：该论文提出了一种主动检索增强生成方法，能够根据生成的上下文预测未来内容，进而检索相关文档，提高生成文本的准确性。相比于现有的检索增强模型，该方法具有更好的泛化性和适用性。

其他亮点：该论文的实验设计充分，使用了四个长文本生成任务/数据集进行测试，并提供了数据集和代码。该方法在所有任务上均取得了优异的表现，证明了其有效性。此外，该论文的主要作者来自多个知名机构，具有丰富的研究经验和成果。

关于作者：

Zhengbao Jiang, Frank F. Xu, Luyu Gao, Zhiqing Sun, Qian Liu, Jane Dwivedi-Yu, Yiming Yang, Jamie Callan, Graham Neubig
[CMU]

Language Technologies Institute, Carnegie Mellon University
Sea AI Lab 、Meta AI Research

论文摘要：本文提出了一种新的语言模型增强方法——主动检索增强生成（Active Retrieval Augmented Generation）。虽然大型语言模型在理解和生成语言方面具有显著能力，但它们往往会产生虚构和事实不准确的输出。从外部知识资源中检索信息是一种很有前途的解决方案。然而，大多数现有的检索增强语言模型只在输入时检索一次信息，这在生成长文本等更一般的场景中具有局限性，因为在生成过程中不断收集信息是必要的。过去有一些尝试在生成输出时多次检索信息，但大多数都是使用上下文作为查询，以固定间隔检索文档。本文提出了一种主动检索增强生成的通用视角，即在生成过程中主动决定何时以及如何检索信息。我们提出了一种名为FLARE的通用检索增强生成方法，它使用即将生成的句子的预测来预测未来的内容，并将其用作查询来检索相关文档，以重新生成句子。我们在四个长形式知识密集型生成任务/数据集上对FLARE进行了全面测试，并与基线进行了比较。FLARE在所有任务上都取得了优越或有竞争力的表现，证明了我们的方法的有效性。代码和数据集可在https://github.com/jzbjyb/FLARE上获得。

Active Retrieval Augmented Generation

提出一种主动检索增强生成的框架，通过预测即将生成的句子来检索相关信息，以提高生成结果的准确性和可靠性。

动机：大型语言模型(LLM)在理解和生成语言方面具有显著能力，但它们倾向于产生虚构和事实不准确的输出。通过从外部知识资源中检索信息来增强LLM是一个有希望的解决方案。
方法：提出一种主动检索增强生成的框架，决定在生成过程中何时以及何种信息进行检索。采用前瞻性主动检索，通过预测即将生成的句子，检索相关信息来重新生成包含低置信度Token的句子。
优势：在4个长文本知识密集型生成任务/数据集上，FLARE在所有任务上实现了优越或具有竞争力的性能，证明了该方法的有效性。

内容中包含的图片若涉及版权问题，请及时与我们联系删除

主动检索增强生成

评论列表

评论