Large Language Models Lack Understanding of Character Composition of Words

简介

大型语言模型（LLMs）在各种自然语言任务中展现出了卓越的表现。然而，LLMs的成功主要局限于涉及单词、句子或文档的任务，他们对文本的最小单位——字符的理解程度仍然值得怀疑。在本文中，我们研究了当代LLMs对于理解单词字符组成的能力，并展示了其中大多数无法可靠地完成即使是人类可以完美完成的简单任务。我们通过与标记级别表现的比较分析了它们的行为，并讨论了未来研究的潜在方向。
图表
解决问题

本论文旨在探究当代大型语言模型对于理解单词最小文本单位——字符的能力，并发现大多数模型不能可靠地完成人类可以完美完成的简单任务。
关键思路

本论文分析了当前大型语言模型在理解单词字符构成方面的表现，并将其与标记级别的表现进行比较，讨论了未来研究的潜在方向。
其它亮点

本论文的实验设计详细，使用了多个数据集进行测试，并与其他模型进行了比较。结果显示，大多数模型不能很好地理解字符构成，这表明了未来研究的重要性。论文还提出了一些可能的解决方案。
相关研究

最近的相关研究包括《BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding》和《XLNet: Generalized Autoregressive Pretraining for Language Understanding》。