ROCOv2: Radiology Objects in COntext Version 2, an Updated Multimodal Image Dataset

简介

自动化医学图像分析系统通常需要大量高质量标签的训练数据，这些数据难以生成且耗时。本文介绍了辐射学上下文对象第二版（ROCOv2），这是一个多模态数据集，包含从PMC Open Access子集中提取的放射学图像、相关医学概念和字幕。它是2018年发布的ROCO数据集的更新版本，新增了35,705张自2018年以来添加到PMC的新图像。它进一步为X射线提供了手动策划的成像模态和附加的解剖和方向概念。该数据集包含79,789张图像，已经被用于ImageCLEFmedical Caption 2023的概念检测和字幕预测任务，只做了少量修改。该数据集适用于基于图像-字幕对的图像注释模型的训练，或使用每个图像提供的统一医学语言系统（UMLS）概念进行多标签图像分类。此外，它可以用于医学领域模型的预训练和多任务学习的深度学习模型的评估。
图表
解决问题

本文旨在介绍Radiology Object in COntext version 2 (ROCOv2)数据集，以解决医学图像分析系统所需的高质量标签数据难以生成的问题。
关键思路

ROCOv2数据集是一个多模态数据集，包含从PMC开放访问子集中提取的放射学图像、相关医学概念和标题，可用于训练基于图像-标题对的图像注释模型，或使用每个图像提供的统一医学语言系统（UMLS）概念进行多标签图像分类。
其它亮点

ROCOv2数据集包含79,789张图像，手动筛选了成像模态的概念，并为X射线提供了额外的解剖和方向概念。文章还介绍了使用ROCOv2数据集在ImageCLEFmedical Caption 2023中进行概念检测和标题预测任务的结果。此外，该数据集还可用于医学领域模型的预训练和多任务学习的深度学习模型的评估。
相关研究

最近的相关研究包括：1）ROCO数据集，该数据集是ROCOv2的更新版本；2）医学图像注释和分类的其他数据集，如MURA和ChestX-ray14。

ROCOv2: Radiology Objects in COntext Version 2, an Updated Multimodal Image Dataset

评论