First Heuristic Then Rational: Dynamic Use of Heuristics in Language Model Reasoning

2024年06月23日
  • 简介
    多步推理在语言模型(LMs)中被广泛采用以探索更好的性能。我们报告了LMs在这一过程中使用的系统策略。我们的对照实验揭示了LMs在需要更多步骤才能达到答案的早期阶段更加依赖启发式方法,例如词汇重叠。相反,随着LMs逐渐接近最终答案,它们对启发式方法的依赖程度降低。这表明,在涉及多步推理的任务中,LMs仅跟踪有限数量的未来步骤,并动态地将启发式策略与逻辑策略相结合。
  • 作者讲解
  • 图表
  • 解决问题
    论文试图研究语言模型在多步推理中的策略和表现,探索其使用启发式方法和逻辑方法的动态组合。
  • 关键思路
    语言模型在多步推理中会动态组合启发式方法和逻辑方法,更倾向于在较早的阶段使用启发式方法,随着推理的进行逐渐减少启发式方法的使用。
  • 其它亮点
    论文通过控制实验揭示了语言模型在多步推理中的策略,使用了多个数据集进行实验,并提供了代码开源。
  • 相关研究
    最近的相关研究包括《Multi-step Reasoning with Dense Retrieval》和《Neural Module Networks for Reasoning over Text》。
许愿开讲
PDF
原文
点赞 收藏
向作者提问
NEW
分享到Link

提问交流

提交问题,平台邀请作者,轻松获得权威解答~

向作者提问