BIMCV-R: A Landmark Dataset for 3D CT Text-Image Retrieval

2024年03月24日
  • 简介
    医疗保健中三维医学成像技术的广泛应用导致医疗专业人员的工作量显著增加。为了协助临床医生进行诊断并减轻其工作负担,开发一个可靠的检索类似病例的系统提供了一个可行的解决方案。虽然这个概念有很大的前途,但是三维医学文本-图像检索领域目前受到评估基准和策划数据集的缺乏的限制。为了解决这个问题,我们的研究提供了一个开创性的数据集BIMCV-R(该数据集将在获得认可后发布),其中包括8069个三维CT体积的广泛收集,涵盖超过200万张切片,以及它们各自的放射学报告。在我们数据集的基础上,我们开发了一种检索策略MedFinder。这种方法采用双流网络架构,利用大型语言模型的潜力,将医学图像检索领域推向超越现有文本-图像检索解决方案的方向。这标志着我们朝着开发一个能够促进文本到图像、图像到文本和基于关键字的检索任务的系统迈出了初步的一步。
  • 图表
  • 解决问题
    论文旨在解决医疗专业人员因3D医学成像技术的普及而面临的工作量增加的问题,提出一种可靠的检索系统来帮助医生诊断,并减轻他们的工作负担。
  • 关键思路
    论文提出了一种双流网络架构的检索策略MedFinder,利用大型语言模型的潜力,将医学图像检索领域推向超越现有文本-图像检索解决方案的新高度。
  • 其它亮点
    论文提出了一个包含8,069个3D CT体积的数据集BIMCV-R,涵盖了超过200万个切片,并附带相应的放射学报告。实验结果表明,MedFinder检索策略在不同的检索任务中都表现出了很好的性能。论文的数据集将在接受后发布。
  • 相关研究
    在这个领域中,最近的相关研究包括:'DeepLesion: Automated Mining of Large-Scale Lesion Annotations and Universal Lesion Detection with Deep Learning','Deep Learning for Medical Image Analysis: A Review','A Survey on Deep Learning in Medical Image Analysis'等。
PDF
原文
点赞 收藏 评论 分享到Link

沙发等你来抢

去评论