解决长尾分布问题新方法，解耦类别特征并实现空间增广

这篇文章收录于ECCV2020，针对的是分类任务中的长尾分布问题。具体而言，本文的方法将每个类的特征解耦成类特有和类共有特征，将尾部类的类特有特征和头部类的类共有特征进行融合，从而实现特征空间的增广。整体方法简单高效，值得学习。

现实世界的数据通常遵循长尾分布，也就是说每个类的数量通常是不同的。例如，数据集头部类中样本数很多，而尾部类中样本数很少。然而我们希望模型是能够公平的表示整个数据集，而不是偏向某些样本多的类。解决长尾问题的各种方法中，类平衡损失、重采样和数据增广是比较常见的方法。但是对于尾部类来说，我们不得不考虑一些其他知识来弥补丢失的信息。在本文中，作者提出了一种新的方法来解决长尾问题——在特征空间中将头部类的特征增广到尾部类特征上。具体来说是将每个类的特征解耦成类特有和类共有特征，将尾部类的类特有特征和头部类的类共有特征进行融合，从而实现特征空间的增广。该方法在iNaturalist, ImageNet-LT, Places-LT 和长尾的CIFAR集四个数据集上都取得了不错的效果。

论文链接： https://arxiv.org/abs/2008.03673

内容中包含的图片若涉及版权问题，请及时与我们联系删除

解决长尾分布问题新方法，解耦类别特征并实现空间增广

评论