If LLM Is the Wizard, Then Code Is the Wand: A Survey on How Code Empowers Large Language Models to Serve as Intelligent Agents

简介

今天的突出大型语言模型（LLM）与过去的语言模型不仅在大小上有所不同，而且它们是在自然语言和形式语言（代码）的组合上进行训练的。作为人类和计算机之间的媒介，代码将高级目标转化为可执行步骤，具有标准语法、逻辑一致性、抽象和模块化特性。在本次调查中，我们概述了将代码整合到LLM的训练数据中的各种好处。具体而言，除了增强LLM的代码生成能力外，我们还观察到代码的这些独特属性有助于（i）解锁LLM的推理能力，使其能够应用于更复杂的自然语言任务；（ii）引导LLM产生结构化和精确的中间步骤，然后通过函数调用连接到外部执行端点；以及（iii）利用代码编译和执行环境，这也为模型改进提供了多样化的反馈。此外，我们追踪了LLM通过代码带来的这些深刻能力，如何使它们成为智能代理（IA），在需要理解指令、分解目标、计划和执行操作以及从反馈中提炼关键信息的情况下，这些能力对它们在下游任务中的成功至关重要。最后，我们介绍了赋予LLM代码能力的几个关键挑战和未来方向。
图表
解决问题

将自然语言和代码结合起来，用于训练大型语言模型的优势是什么？这种方法是否可以提高语言模型的推理能力和生成代码的质量？
关键思路

将代码作为训练数据，可以帮助语言模型更好地理解指令、分解目标、规划和执行动作，并从反馈中不断改进。代码的结构化和精确性也可以提高生成代码的质量。
其它亮点

论文介绍了将代码与自然语言结合训练语言模型的方法，并探讨了这种方法的优势。实验结果表明，将代码作为训练数据可以提高语言模型的推理能力和生成代码的质量。此外，这种方法还可以将语言模型应用于更复杂的自然语言任务，并将其应用于智能代理。
相关研究

近年来，许多研究都在探索将代码和自然语言结合起来训练语言模型的方法。例如，CodeBERT，GPT-Code，等等。

If LLM Is the Wizard, Then Code Is the Wand: A Survey on How Code Empowers Large Language Models to Serve as Intelligent Agents

评论