ImageNet零样本准确率首次超过80%，地表最强开源CLIP模型更新

虽然ImageNet早已完成历史使命，但其在计算机视觉领域仍然是一个关键的数据集。

2016年，在ImageNet上训练后的分类模型，sota准确率仍然还不到80%；时至今日，仅靠大规模预训练模型的zero-shot泛化就能达到80.1%的准确率。

最近LAION使用开源代码OpenCLIP框架训练了一个全新的 ViT-G/14 CLIP 模型，在 ImageNet数据集上，原版OpenAI CLIP的准确率只有75.4%，而OpenCLIP实现了80.1% 的zero-shot准确率，在 MS COCO 上实现了74.9% 的zero-shot图像检索（Recall@5），这也是目前性能最强的开源 CLIP 模型。

LAION全称为Large-scale Artificial Intelligence Open Network，是一家非营利组织，其成员来自世界各地，旨在向公众提供大规模机器学习模型、数据集和相关代码。他们声称自己是真正的Open AI，100%非盈利且100%免费。

感兴趣的小伙伴可以把手头的CLIP模型更新版本了！

模型地址：https://huggingface.co/laion/CLIP-ViT-bigG-14-laion2B-39B-b160k

内容中包含的图片若涉及版权问题，请及时与我们联系删除

ImageNet零样本准确率首次超过80%，地表最强开源CLIP模型更新

评论