AAAI2021 | 长尾识别中的trick大礼包

南京大学&南理工&旷视科技的研究员针对长尾识别问题中“技巧”进行了系统的探索，对相关“技巧”的组合进行了科学的实验对比，与此同时提出了一种基于CAM的re-sampling方案，最后输出了一组最佳“技巧大礼包”并在四个公开数据集上验证了其性能，相比已有方案，所提“技巧大礼包”取得10%的误差率下降，这对于该领域的未来研究提供了一份很有价值的参考手册。

论文名称：Bag of Tricks for Long-Tailed Visual Recognition with Deep Convolutional Neural Networks

近年来，基于深度学习的方法在长尾分布(类别不平衡)数据上取得了极大进展。除了这些复杂的方法外，训练过程中的那些简单“技巧”(比如数据分布、损失函数的调整)同样起着不小的贡献。然而，不同的“技巧”之间可能存在“冲突”。如果采用了不合理的“技巧”进行长尾相关的任务，这就很可能导致较差的识别精度。不幸的是，关于这些“技巧”并无科学系统的手册供参考。

鉴于此，该文对长尾识别中常用的“技巧”进行了收集并进行了充分而系统的实验以给出一份详尽的实验手册，同时得到了相关“技巧”的一种有效组合。更进一步，作者还提出了一种基于CAM(Class Activation Maps)的数据增广方案，所提方案可以与re-sampling方法友好组合并取得更好效果。

通过科学的组合这些“技巧”，该文在四个长尾基准数据集(包含ImageNet-LT、INaturalist2018)上取得了优于SOTA方案的结果。该文的主要贡献包含以下几点：

系统地探索了现有简单、超参不敏感的长尾相关“技巧”，为后续研究提供了一份有价值的实践手册；
提出了一种基于CAM的适用于两阶段的采样方案，所提方案简单有效；
进行了充分的实验并得到了一组最优组合，所提组合方案在四个长尾公开数据集取得了SOTA结果。

感兴趣的可以戳原文。

内容中包含的图片若涉及版权问题，请及时与我们联系删除

AAAI2021 | 长尾识别中的trick大礼包

评论列表

评论