标题:Google、斯坦福、北卡罗来纳大学、DeepMind|Emergent Abilities of Large Language Models(大型语言模型的新兴能力)

作者:Jason Wei, Yi Tay, Jeff Dean, William Fedus等

简介:本文介绍了语言模型的新特征。语言模型已经展示了以可预测的方式提高各种下游的性能和样本效率的能力。本文讨论了一种不可预测的现象,作者称之为大语言模型的新兴能力。考虑一种能够成为新兴者的能力,如果它不是存在于较小的模型中,但存在于较大的模型。因此,新兴能力不能只需通过推断较小模型进行预测。新兴能力存在意味着额外的尺寸增加可以进一步扩大语言模型的能力。

论文下载:https://arxiv.org/pdf/2206.07682v1.pdf

 

内容中包含的图片若涉及版权问题,请及时与我们联系删除