【论文标题】CytoImageNet: A large-scale pretraining dataset for bioimage transfer learning

【作者团队】Stanley Bryan Z. Hua, Alex X. Lu, Alan M. Moses

【发表时间】2021/11/24

【机 构】多伦多大学

【论文链接】https://arxiv.org/abs/2111.11646v2

【代码链接】https://github.com/stan-hua/CytoImageNet

【数据链接】https://www.kaggle.com/stanleyhua/cytoimagenet

近年来,以图像为基础的生物检测已逐渐成进入高通量的时代,从数十万张图像中提取有生物学意义的信息引发了对相应快速自动化方法和工具的需求。从ImageNet的成功中得到启发,本文策划了CytoImageNet,这是一个由公开来源和弱标记的显微镜图像组成的大规模数据集,包括890,737张显微镜图像和894个类。对CytoImageNet的预训练产生的特征在下游的显微镜分类任务中与ImageNet的特征具有竞争力,融合提取的特征在下游任务中的表现最好,这意味着CytoImageNet和ImageNet的预训练导致了不同的、但有意义的图像表征的学习。这些结果表明,未来生物图像迁移学习的应用可能会从CytoImageNet和ImageNet特征的融合中获益。

上图展示了CytoImageNet类的例子,每个类别显示了两个代表性类别的两张代表性图像。

上图展示了在下游任务中,比较EfficientNetB0倒数第二层特征的kNN分类精度及95%置信区间。Random指的是随机初始化权重的模型,Fusion是指ImageNet特征和CytoImageNet特征的串联。可以看到随机初始化的特征与ImageNet特征的融合没有带来性能上的提高。

内容中包含的图片若涉及版权问题,请及时与我们联系删除