- 简介自我纠正是一种通过在推理过程中使用LLMs来改进响应的方法。先前的研究提出了各种自我纠正框架,包括自我评估和外部反馈等不同来源的反馈,但是关于LLMs何时能够纠正自己的错误仍然没有共识,因为最近的研究也报告了负面结果。在这项工作中,我们对广泛的论文进行了批判性调查,并讨论了成功自我纠正所需的条件。我们首先发现,先前的研究通常没有详细定义其研究问题,并涉及不切实际的框架或过度评估自我纠正的不公平评估。为了解决这些问题,我们对自我纠正研究中的研究问题进行分类,并提供了设计适当实验的检查表。我们基于新分类的研究问题进行的批判性调查显示:(1)先前的研究没有证明在一般任务中通过提示LLMs的反馈实现成功的自我纠正,(2)自我纠正在可以使用可靠的外部反馈的任务中表现良好,(3)大规模微调可以实现自我纠正。
- 图表
- 解决问题本文旨在批判性地调查自我校正的广泛论文,并讨论成功自我校正所需的条件。
- 关键思路本文提供了一个分类研究问题的框架,并提供了设计适当实验的检查清单。本文发现,自我校正适用于可以使用可靠外部反馈的任务,并且大规模微调可以实现自我校正。
- 其它亮点本文提供了一个分类研究问题的框架,并提供了设计适当实验的检查清单。本文发现,自我校正适用于可以使用可靠外部反馈的任务,并且大规模微调可以实现自我校正。
- 最近的相关研究包括使用不同类型的反馈进行自我校正的论文,如自我评估和外部反馈。
沙发等你来抢
去评论
评论
沙发等你来抢