Improving Arithmetic Reasoning Ability of Large Language Models through Relation Tuples, Verification and Dynamic Feedback

简介

目前，大型语言模型中用于推理步骤的表示大多可分为两种主要类型：（1）自然语言，难以验证；（2）非自然语言，通常是编程代码，对于不熟悉编码的人来说阅读困难。本文提出使用半结构化形式来表示大型语言模型的推理步骤。具体而言，我们使用关系元组，这不仅易于人类阅读，而且机器友好，比自然语言更易于验证。我们实现了一个框架，包括三个主要组件：（1）将关系元组引入大型语言模型的推理步骤；（2）基于关系元组实现推理步骤的自动验证过程，使用本地代码解释器；（3）集成一个简单而有效的动态反馈机制，我们发现这对于大型语言模型的自我改进很有帮助。在各种算术数据集上的实验结果表明，我们的方法在提高大型语言模型的算术推理能力方面是有效的。源代码可在https://github.com/gpgg/art上获得。
图表
解决问题

论文试图提出一种半结构化的表示方法来表示大型语言模型的推理步骤，以便更容易验证和理解。
关键思路

使用关系元组作为半结构化的表示方法，可以使推理步骤更易于理解和验证。同时，引入一个基于关系元组的本地代码解释器实现自动验证，以及一个简单有效的动态反馈机制来帮助大型语言模型自我提升。
其它亮点

论文实现了一个包括三个主要组件的框架：（1）将关系元组引入大型语言模型的推理步骤中；（2）使用基于关系元组的本地代码解释器实现推理步骤的自动验证；（3）集成一个简单有效的动态反馈机制来帮助大型语言模型自我提升。实验结果表明，该方法在提高大型语言模型的算术推理能力方面非常有效。
相关研究

最近的相关研究主要集中在大型语言模型的推理能力上，例如使用记忆增强技术和递归神经网络等方法来提高模型的推理能力。相关论文包括《End-to-End Memory Networks》和《A Simple Neural Network Module for Relational Reasoning》等。

Improving Arithmetic Reasoning Ability of Large Language Models through Relation Tuples, Verification and Dynamic Feedback

评论