【人脸识别】WebFace260M: A Benchmark Unveiling the Power of Million-Scale Deep Face Recognition(CVPR2021) 【论文链接】https://arxiv.org/abs/2103.04098 【作者团队】Zheng Zhu, Guan Huang, Jiankang Deng, Yun Ye, Junjie Huang, Xinze Chen, Jiagang Zhu, Tian Yang, Jiwen Lu, Dalong Du, Jie Zhou 【机构】清华大学,芯翌科技,伦敦帝国理工学院 【项目地址】https://www.face-benchmark.org/ 【发表时间】2021/03/09 【推荐理由】 本文提出了一个新的用于人脸识别的百万级数据集,已开放下载,文章被CVPR2021接收。 在本文中,作者提出了一个新的百万级人脸数据集,其中包含噪声的4M身份/2.6亿个人脸数据(WebFace260M)和干净的2M身份/ 42M人脸(WebFace42M)训练数据,以及精心设计的受时间限制的评估协议。首先,作者收集4M名单,并从互联网上下载2.6亿张人脸图片。然后,设计了一种自动利用自我训练(CAST)的自动清洗管道来净化巨大的WebFace260M,它高效且可扩展。清理过的WebFace42M是最大的公众人脸识别训练集,我们希望缩小学术界和行业之间的数据鸿沟。参照实际场景,作者构造了在推理时间约束下的人脸识别(FRUITS)协议和测试集,以全面评估人脸匹配器。 有了这个基准,作者就研究了百万级的人脸识别问题。开发了分布式框架以有效地训练人脸识别模型而不会影响性能。在WebFace42M的支持下,文章将具有挑战性的IJB-C数据集的失败率降低了40%,在NIST-FRVT的430个条目中排名第三。与公共训练集相比,即使10%的数据(WebFace4M)也显示出优异的性能。此外,作者在FRUITS-100ms / 500ms / 1000ms协议下的丰富属性测试集上建立了全面的基线,包括MobileNet,EfficientNet,AttentionNet,ResNet,SENet,ResNeXt和RegNet系列。
内容中包含的图片若涉及版权问题,请及时与我们联系删除
评论
沙发等你来抢