PNAS 速递：增量语言产生中的信息论原则

关键词：语言产生过程，信息论，控制论，强化学习

论文标题：Information-theoretic principles in incremental language production
论文来源：PNAS
斑图链接：https://pattern.swarma.org/paper/a7584726-574b-11ee-9a25-0242ac17000d
原文链接：https://www.pnas.org/doi/10.1073/pnas.2220593120

理解语言产生过程以及这些过程所受的计算约束是研究思维、语言和交流的关键挑战，关于语言产生的实证研究已经揭示了这是一个主要是增量的过程：说话者不会从头到尾规划完整的话语，而是在说话的过程中规划它，同时整合与他们的语言约定、听众的实际和可能的反应以及他们自己的交际目标有关的信息，而所有这些都在导致困难和错误的计算约束下进行。

文章运用了一个最近出现的关于动作选择复杂性的视角，即速率失真的控制理论（rate–distortion theory of control, RDC），提出一种关于人类语言产生中错误和困难的计算层面模型，该模型基于信息论和控制论，提供一个统一的语言产生视角，与强化学习和更一般的信息论模型在形式上相关。

图1 基于 RDC 的语言生成策略示例和示意图。

语言产生被视为为实现沟通目标而进行的顺序动作选择，受到认知控制容量约束的影响，通过一系列的计算、模拟、语料库分析以及与实验数据的比较，作者展示了这个模型直接预测了语言产生中已知的一些主要定性和定量现象，包括词汇选择中的语义干扰和可预测性效应；在词语顺序变化中基于可访问性的产生偏好；以及包括填充性停顿、更正和起始失误在内的言语流畅性的存在和分布。