FocusMAE: Gallbladder Cancer Detection from Ultrasound Videos with Focused Masked Autoencoders

2024年03月13日
  • 简介
    近年来,自动化胆囊癌(GBC)检测引起了研究人员的关注。目前最先进的方法依赖于超声造影(US)图像,但其具有有限的泛化能力,强调了需要采用革命性方法。我们观察到,单个US帧可能缺乏足够的信息来捕捉疾病表现。本研究倡导采用基于视频的GBC检测的新范式,利用时空表示的固有优势。通过使用Masked Autoencoder(MAE)进行表示学习,我们解决了传统基于图像的方法的缺点。我们提出了一种新的设计,称为FocusMAE,以系统性地偏向于从高信息区域选择掩蔽令牌,促进更精细的恶性表现。此外,我们为GBC检测贡献了最广泛的US视频数据集。我们还指出,这是第一项关于US视频GBC检测的研究。我们在策划的数据集上验证了所提出的方法,并报告了GBC检测问题的新的最先进(SOTA)准确率为96.4%,而当前基于图像的SOTA-GBCNet、RadFormer的准确率为84%,基于视频的SOTA-AdaMAE的准确率为94.7%。我们进一步展示了所提出的FocusMAE在公共基于CT的Covid检测数据集上的普适性,并报告了比当前基线提高3.3%的准确率。源代码和预训练模型可在以下网址获得:https://github.com/sbasu276/FocusMAE。
  • 图表
  • 解决问题
    提出一种基于视频的胆囊癌检测方法,解决当前基于超声成像的图像方法存在的泛化能力有限的问题。
  • 关键思路
    使用遮罩自编码器(MAE)进行表示学习,提出了一种名为FocusMAE的新设计,通过有针对性地选择高信息区域的遮罩令表示更加精细。同时,构建了迄今为止最大的超声视频数据集,实现了96.4%的GBC检测准确率,相比当前基于图像的SOTA方法提高了12.4%。
  • 其它亮点
    本研究提出了一种基于视频的胆囊癌检测方法,引入了遮罩自编码器进行表示学习,并提出了一种名为FocusMAE的新设计。同时,构建了迄今为止最大的超声视频数据集,并实现了96.4%的GBC检测准确率。研究还将提出的方法应用于公共CT数据集上,取得了3.3%的准确率提升。
  • 相关研究
    相关研究包括基于超声成像的图像方法,如GBCNet和RadFormer,以及基于视频的方法,如AdaMAE。
PDF
原文
点赞 收藏 评论 分享到Link

沙发等你来抢

去评论