论文标题:MixupE: Understanding and Improving Mixup from Directional Derivative Perspective
论文链接:https://arxiv.org/abs/2212.13381
作者单位:蒙特利尔大学 & 阿尔托大学 & 谷歌大脑
Mixup是一种流行的数据增强技术,用于训练深度神经网络,其中通过线性插值输入对及其标签生成额外的样本。众所周知,这种技术可以提高许多学习范式和应用中的泛化性能。在这项工作中,我们首先分析Mixup,并表明它隐式正则化了所有阶的无限多方向导数。然后,我们提出了一种基于新颖洞察力的新方法来改进Mixup。为了证明所提出方法的有效性,我们跨图像、表格数据、语音和图等各个领域进行了实验。我们的结果表明,所提出的方法使用各种架构改进了各种数据集的Mixup,例如,在ImageNet Top-1准确率方面比Mixup提高了0.8%。
内容中包含的图片若涉及版权问题,请及时与我们联系删除
评论
沙发等你来抢