- 简介在含有嘈杂类标签的训练中,会影响神经网络的泛化性能。在这种情况下,mixup是一种流行的正则化技术,通过使记忆错误的类标签更加困难来提高训练的鲁棒性。然而,mixup忽略了通常情况下,多个注释者(例如众包工人)会提供类标签。因此,我们提出了mixup的扩展,它处理每个实例的多个类标签,同时考虑哪个类标签来自哪个注释者。它被集成到我们的多注释者分类框架annot-mix中,对由人类或模拟注释者提供的11个具有嘈杂类标签的数据集表现出优越的性能,优于八种最先进的方法。我们的代码可通过我们在https://github.com/ies-research/annot-mix的存储库公开获取。
- 图表
- 解决问题论文旨在解决在训练神经网络时使用带有噪声的类标签会影响其泛化性能的问题。同时,考虑到通常会有多个注释者提供类标签,因此论文提出了一种扩展的mixup方法,可以处理每个实例的多个类标签,并考虑每个类标签来自哪个注释者。
- 关键思路论文提出了一种名为annot-mix的多注释者分类框架,它使用扩展的mixup方法来处理具有噪声的多个类标签。该方法考虑到每个类标签的来源,从而提高了模型的泛化性能。
- 其它亮点论文在11个具有噪声类标签的数据集上进行了实验,包括人类和模拟注释者提供的数据集。实验结果表明,annot-mix方法在性能上优于八种现有的方法。此外,论文提供了公开可用的代码库。
- 与该论文相关的研究包括使用深度学习来处理带有噪声标签的分类问题的其他方法,如Co-teaching和F-correction。
沙发等你来抢
去评论
评论
沙发等你来抢