不要停止预训练！根据目标领域和任务继续调整语言模型

本文获ACL2020最佳论文荣誉提名奖。论文指出：在预训练模型的基础上，采用目标领域数据集继续进行预训练（DAPT）可以提升效果；目标领域与语言模型的原始预训练语料越不相关，DAPT效果则提升更明显。在具体任务的数据集上继续预训练（TAPT）也可以很轻松的地提升效果。先进行DAPT，再进行TAPT也可以进一步提升效果。如能获取更多的、任务相关的无标注数据继续预训练（Curated-TAPT）则效果最好。采取一种轻量化的简单数据选择策略也会提升效果。这篇论文为预训练技术的进一步发展提供了新的思路。