First Heuristic Then Rational: Dynamic Use of Heuristics in Language Model Reasoning

简介

多步推理在语言模型（LMs）中被广泛采用以探索更好的性能。我们报告了LMs在这一过程中使用的系统策略。我们的对照实验揭示了LMs在需要更多步骤才能达到答案的早期阶段更加依赖启发式方法，例如词汇重叠。相反，随着LMs逐渐接近最终答案，它们对启发式方法的依赖程度降低。这表明，在涉及多步推理的任务中，LMs仅跟踪有限数量的未来步骤，并动态地将启发式策略与逻辑策略相结合。
作者讲解

目前尚无作者解读视频，你可点击下方【许愿开讲】按钮，许愿作者开讲~
图表
解决问题

论文试图研究语言模型在多步推理中的策略和表现，探索其使用启发式方法和逻辑方法的动态组合。
关键思路

语言模型在多步推理中会动态组合启发式方法和逻辑方法，更倾向于在较早的阶段使用启发式方法，随着推理的进行逐渐减少启发式方法的使用。
其它亮点

论文通过控制实验揭示了语言模型在多步推理中的策略，使用了多个数据集进行实验，并提供了代码开源。
相关研究

最近的相关研究包括《Multi-step Reasoning with Dense Retrieval》和《Neural Module Networks for Reasoning over Text》。