本文对示例增强的(example augmented)自然语言处理的一些相关工作进行了介绍和探讨。
近年来随着预训练技术的发展,通过在海量文本语料上进行预训练,模型已经在大多数自然语言处理任务上取得了卓越的性能。但是目前看来,参数量相对较小的模型还是很难将预训练语料中的知识充分的存储到自身参数当中。因此,除开当前被做的越来越大的预训练模型,另一部分研究工作关注于如何用非参数化的外部语料/知识库来增强模型,例如让模型从语料库中检索出对完成当前任务有益的文档。
笔者认为这些用外部知识增强模型的方法,从知识类型上大致可以分为两类:第一类方法可以为模型提供涵盖面较广的知识,这些外部知识中通常直接或间接包含了当前任务的答案,例如问答任务中的文档或是知识图谱,因此这一类方法的性能很大程度上取决于检索模块的精度,即模型能否准确定位到自己所需要的知识。第二类方法提供的则是可供模型在某些方面进行参考的示例(example),例如问答任务中的问题-答案对,本文将这类方法简称为示例增强(example augmented)方法,并针对这类方法选取了八篇文章,分成四个小类进行简要介绍,其中参杂了一些个人体会,如有错误和不足,欢迎大家指正。内容中包含的图片若涉及版权问题,请及时与我们联系删除
评论
沙发等你来抢