经典的机器学习隐含地假设训练数据的标签是从一个干净的分布中采样的,这对于真实的场景来说限制太大了。然而,基于统计学习的方法可能不能很好地训练深度学习模型。因此,迫切需要设计标签噪声表示学习(LNRL)方法对带噪声标签的深度模型进行鲁棒训练。为了充分了解LNRL,我们进行了综述。我们首先从机器学习的角度阐明LNRL的形式化定义。然后,通过学习理论和实证研究的视角,找出了噪声标签影响深度模型性能的原因。在此基础上,我们将不同的LNRL方法分为三个方向。在这个统一的分类法下,我们将全面讨论不同类别的优缺点。更重要的是,我们总结了鲁棒的LNRL的基本组件,它们可以激励新的方向。最后,我们提出了LNRL可能的研究方向,如新数据集、实例依赖的LNRL和对抗性LNRL。最后,我们展望了LNRL之外的潜在方向,比如使用特征噪声、偏好噪声、领域噪声、相似性噪声、图形噪声和演示噪声进行学习。
论文链接:https://arxiv.org/abs/2011.04406
内容中包含的图片若涉及版权问题,请及时与我们联系删除


评论
沙发等你来抢