本文描述了语言模型的发展历史,指出未来可能的发展方向。

本文从计算机科学的发展历史和未来趋势的角度简要介绍语言建模,特别是预训练语言模型,对 NLP 领域的基本概念、直观解释、技术成就和面临的挑战展开了综述,为初学者提供了关于预训练语言模型的参考文献。

自然语言处理是计算机科学(CS)、人工智能(AI)和语言学的一个交叉领域,包括机器翻译、阅读理解、对话系统、文本摘要、文本生成等应用。近年来,深度学习已成为自然语言处理的基础技术。

借助数学知识对人类语言建模主要有两种方法:一种是基于概率,另一种是基于形式语言。这两种方法也可以结合使用。从基本框架的角度看,语言模型属于第一类。语言模型是定义在单词序列(句子或段落)上的概率分布。

本文首先介绍马尔可夫和香农的研究中关于语言建模的基本概念;然后讨论了诺姆 • 乔姆斯基提出的语言模型(基于形式语言理论),描述了神经语言模型的定义及其对传统语言模型的扩展;接下来解释了预训练语言模型的基本思想,讨论了神经语言建模方法的优势和局限性,并对 NLP 的未来进行了展望。

内容中包含的图片若涉及版权问题,请及时与我们联系删除