DeepMind|使用大型语言模型进行可信推理

标题：DeepMind|Faithful Reasoning Using Large Language Models（使用大型语言模型进行可信推理）

作者：Antonia Creswell, Murray Shanahan

简介：本文研究了大模型在推理领域的效果。尽管当代大型语言模型 (LM) 展示了令人印象深刻的问答能力，但它们的答案通常是对模型的一次调用的产物。这会带来不受欢迎的不透明程度并影响性能，尤其是在本质上是多步骤的问题上。为了解决这些限制，作者展示了如何通过一个因果结构反映问题的潜在逻辑结构的过程来使 LMs 执行忠实的多步推理。作者的方法通过将推理步骤链接在一起来工作，其中每个步骤都来自对两个微调LM的调用，一个用于选择，一个用于推理，以产生有效的推理跟踪。作者的方法通过推理轨迹空间进行波束搜索以提高推理质量。作者证明了作者的模型在多步逻辑推理和科学问答方面的有效性，表明它在最终答案准确性方面优于基线，并生成了人类可解释的推理轨迹，其有效性可以由用户检查。

论文下载：https://arxiv.org/pdf/2208.14271v1.pdf

内容中包含的图片若涉及版权问题，请及时与我们联系删除

DeepMind|使用大型语言模型进行可信推理

标题：DeepMind|Faithful Reasoning Using Large Language Models（使用大型语言模型进行可信推理）

评论列表

评论