论文标题:

PCRLv2 A Unified Visual Information Preservation Framework for Self-supervised Pre-training in Medical Image Analysis

论文链接:https://arxiv.org/abs/2301.00772

代码链接:https://github.com/RL4M/PCRLv2

作者单位:香港大学 & 上海科技大学

计算机视觉中自我监督学习 (SSL) 的最新进展主要是比较,其目标是通过比较孪生图像视图来保留潜在表示中的不变性和判别性语义。 然而,保留的高级语义不包含足够的局部信息,这在医学图像分析(例如,基于图像的诊断和肿瘤分割)中至关重要。 为了减轻比较 SSL 的局部性问题,我们建议将像素恢复任务明确地纳入将更多像素级信息编码为高级语义。 我们还解决了尺度信息的保存问题,这是帮助图像理解方面的强大的工具,但在 SSL 中并未引起太多关注。 由此产生的框架可以表述为特征金字塔上的多任务优化问题。 具体来说,我们在金字塔中进行多尺度像素恢复和孪生特征比较。 此外,我们提出了 non-skip U-Net 来构建特征金字塔,并开发了 sub-crop 来替代 3D 医学成像中的 multi-crop。 拟议的统一 SSL 框架 (PCRLv2) 在各种任务上优于其自我监督的对应框架,包括脑肿瘤分割 (BraTS 2018)、胸部病理学识别 (ChestX-ray、CheXpert)、肺结节检测 (LUNA) 和腹部器官分割 ( LiTS),有时在注释有限的情况下大幅优于它们。

内容中包含的图片若涉及版权问题,请及时与我们联系删除