标题:清华|FlipDA: Effective and Robust Data Augmentation for Few-Shot Learning(FlipDA:有效且稳健的数据增强小样本学习)

推荐理由:自然语言理解方面的数据增强算法,取得了大部分测评的最佳效果

简介:大多数以前的文本数据增强方法仅限于简单的任务和弱基线。 我们探索了困难任务的数据增强(即小样本自然语言理解)和强基线(即具有超过一个亿参数的预训练模型)。 在这个设定下,我们调研了大量以前的增强方法,并发现这些方法最多只能带来边际收益,甚至有时会大大降低性能。 为了应对这一挑战,我们提出了一种新的数据增强方法FlipDA,它联合使用生成模型和分类器来生成标签翻转数据。FlipDA理念的核心是发现生成标签翻转数据对性能更重要而不是生成标签保留的数据。 实验表明,FlipDA实现了有效性和稳健性之间的良好折衷——它大大提高了许多任务的性能,同时不会对其他任务产生负面影响。

代码下载:https://github.com/zhouj8553/FlipDA

论文下载:http://arxiv-download.xixiaoyao.cn/pdf/2108.06332.pdf

内容中包含的图片若涉及版权问题,请及时与我们联系删除