Hibou: A Family of Foundational Vision Transformers for Pathology

2024年06月07日
  • 简介
    这篇文章介绍了Hibou家族的基础视觉transformers,利用DINOv2框架预训练了两个模型变种Hibou-B和Hibou-L,用于病理学领域。这些模型利用超过100万个全切片图像进行训练,代表了不同的组织类型和染色技术。我们的预训练模型在补丁级别和切片级别的基准测试中表现出优异的性能,超过了现有的最先进方法。值得注意的是,Hibou-L在多个基准数据集上实现了最高的平均准确性。为了支持该领域的进一步研究和应用,我们已经开源了Hibou-B模型,可以在https://github.com/HistAI/hibou上获得访问。数字病理学通过自动化图像分析和大规模数据处理,提高了诊断的准确性、一致性和效率,是诊断各种医学疾病特别是癌症的关键。传统方法往往耗时且容易出错,而数字病理学通过将玻璃切片转换为高分辨率数字图像进行分析,为该领域带来了革命性的变化。基础transformer预训练对于开发稳健、具有普适性的模型至关重要,因为它可以从大量未注释的数据中进行学习。
  • 图表
  • 解决问题
    论文旨在通过数字病理学的方法提高疾病诊断的准确性、一致性和效率。同时,也探索如何通过基础转换器预训练来开发鲁棒、可泛化的模型。
  • 关键思路
    论文提出了Hibou家族的基础视觉转换器,利用DINOv2框架在超过100万个不同组织类型和染色技术的全切片图像上预训练了两个模型变体,Hibou-B和Hibou-L。这些预训练模型在补丁级别和幻灯片级别的基准测试中表现出优异的性能,超过了现有的最先进方法。
  • 其它亮点
    论文的亮点包括:使用数字病理学的方法提高疾病诊断的准确性、一致性和效率;提出了Hibou家族的基础视觉转换器,利用DINOv2框架进行预训练;Hibou-L模型在多个基准数据集上实现了最高的平均准确率;作者已经开源了Hibou-B模型的代码。
  • 相关研究
    最近在数字病理学领域中,还有一些相关的研究,包括:1. 'Deep learning for digital pathology image analysis: A comprehensive tutorial with selected use cases';2. 'Artificial intelligence in digital pathology: a roadmap to routine use in clinical practice';3. 'Interpretable whole-slide cancer diagnosis with deep learning'。
PDF
原文
点赞 收藏 评论 分享到Link

沙发等你来抢

去评论