论文标题:An Efficient Training Approach for Very Large Scale Face Recognition

论文链接:https://arxiv.org/abs/2105.10375

作者单位:新加坡国立大学 & 阿里巴巴 & 中科院等

本文提出了一种针对超大规模人脸识别数据集的新颖训练方法,称为快速人脸分类(F2C,Faster Face Classification),可加快训练速度和减少硬件资源占用!主要创新点:动态类别池DCP和 Dual Loaders。

由于具有超大规模和标签齐全的数据集,人脸识别在深度学习时代已取得了重大进展。但是,对超大规模数据集进行训练非常耗时,并且会占用大量硬件资源。因此,如何设计合适的训练方法是非常关键和必不可少的。训练超大规模数据集的计算和硬件成本主要集中在全连接(FC)层而不是卷积层。为此,我们提出了一种针对超大规模人脸数据集的新颖训练方法,称为快速人脸分类(F2C)。在F2C中,我们首先定义一个Gallery Net和一个Probe Net,分别用于生成身份中心和提取人脸特征以进行人脸识别。 Gallery Net具有与Probe Net相同的结构,并使用移动平均范式从Probe Net继承参数。之后,为了减少FC层的培训时间和硬件资源占用,我们提出了动态类库,该类存储了Gallery Net中的要素并计算出带有正样本的内部产品(logit)(其标识出现在动态类库中)在每个小批量中。动态类池可以被认为是FC层的替代品,它的大小比FC小得多,这就是动态类池可以大大减少时间和资源成本的原因。对于否定样本(其标识未显示在动态类库中),我们将否定样本和动态类库之间的余弦相似性降至最低。然后,为了提高动态类池参数的更新效率和速度,我们设计了双重加载器,包括基于身份的加载器和基于实例的加载器。 Dual Loader通过实例和身份从给定的数据集中加载图像,以生成用于训练的批次。

内容中包含的图片若涉及版权问题,请及时与我们联系删除