RAT: Retrieval Augmented Thoughts Elicit Context-Aware Reasoning in Long-Horizon Generation

向作者提问

NEW

简介

我们探讨了如何通过信息检索来迭代修订一系列思路，从而显著提高大型语言模型在长期生成任务中的推理和生成能力，同时极大地减轻了幻觉。特别地，所提出的方法——“检索增强思路”（RAT）——在生成初始零-shot CoT之后，使用与任务查询、当前和过去的思路步骤相关的检索信息逐步修订每个思路步骤。将RAT应用于GPT-3.5、GPT-4和CodeLLaMA-7b，显著提高了它们在各种长期生成任务上的表现；平均而言，相对评分分别提高了13.63%的代码生成、16.96%的数学推理、19.2%的创意写作和42.78%的具体任务规划。演示页面可在https://craftjarvis.github.io/RAT找到。
作者讲解

目前尚无作者解读视频，你可点击下方【许愿开讲】按钮，许愿作者开讲~
图表
解决问题

论文旨在探索如何通过信息检索迭代修订思维链，从而显著提高大型语言模型在长期生成任务中的推理和生成能力，同时大大减轻幻觉现象。
关键思路

论文提出了一种名为“检索增强思维”（RAT）的方法，它通过检索与任务查询、当前和过去的思维步骤相关的信息来逐步修订每个思维步骤，以生成初始的零-shot CoT。将RAT应用于GPT-3.5、GPT-4和CodeLLaMA-7b，可以显著提高它们在各种长期生成任务上的性能。
其它亮点

论文使用了多个数据集进行实验，包括代码生成、数学推理、创意写作和具体任务规划等任务。实验结果表明，相对评分平均提高了13.63％的代码生成、16.96％的数学推理、19.2％的创意写作和42.78％的具体任务规划。论文提供了一个演示页面，同时也开源了代码。
相关研究

在这个领域中，最近的相关研究包括使用检索增强技术来改进语言模型的其他工作，如《Improving Language Understanding by Generative Pre-Training》和《REALM: Retrieval-Augmented Language Model Pre-Training》等。

许愿开讲

PDF

原文

点赞收藏

向作者提问

NEW

分享到Link

提问交流

提交问题，平台邀请作者，轻松获得权威解答～

向作者提问