伯克利｜Overthinking的真相：理解语言模型如何处理虚假示例

Overthinking the Truth: Understanding how Language Models Process False Demonstrations

Danny Halawi, Jean-Stanislas Denain, Jacob Steinhardt
[UC Berkeley]

Overthinking的真相：理解语言模型如何处理虚假示例

通过分析语言模型中的中间计算过程，揭示了模型在执行过程中错误模仿的问题，并通过削减注意力头实现了性能改进。

内容中包含的图片若涉及版权问题，请及时与我们联系删除