OpenAI 研究员：数据不足时，如何实现监督学习

现实应用中，数据易得，而有标签的数据少有。

一般而言，当监督学习任务面临标签数据不足问题时，可以考虑以下四种解决办法：

1.预训练+微调：首先在一个大规模无监督数据语料库上对一个强大的任务无关模型进行预训练（例如通过自监督学习在自由文本上对语言模型进行预训练，或者在无标签图像上对视觉模型进行预训练），之后再使用一小组标签样本在下游任务上对该模型进行微调。

2.半监督学习：同时从标签样本和无标签样本中学习，研究者使用该方法在视觉任务上进行了大量研究。

3.主动学习：标注成本高，即便成本预算有限，也希望尽可能收集更多的标签数据。主动学习学习选择最有价值的无标签样本，并在接下来的收集过程中收集此类数据，在预算有限的情况下，帮助模型尽可能达到预期效果。

4.预训练+数据集自动生成：给定一个功能强大的预训练模型，可以利用该模型来自动生成更多得多的标签样本。受小样本学习大获成功的驱动，该方法在语言领域的应用尤其普遍。

本文全面介绍半监督学习这一方法，作者为OpenAI研究员Lilian Weng，博客地址：https://lilianweng.github.io/

包括：半监督学习的定义、符号说明、一致性正则化假设、伪标签、预训练等内容。

内容中包含的图片若涉及版权问题，请及时与我们联系删除