Multiple Instance Learning with random sampling for Whole Slide Image Classification

向作者提问

NEW

简介

在计算病理学中，使用多实例学习（MIL）方法训练时对补丁进行随机采样可以提高计算效率并作为一种正则化策略。尽管具有很多优点，但是关于样本大小的性能趋势以及其对模型可解释性的影响仍然存在疑问。在解决这些问题时，我们发现在CAMELYON16数据集上使用30%的补丁可以将性能提高1.7%，而在TUPAC16数据集上仅使用8个样本就可以将性能提高3.7%。我们还发现可解释性效果强烈依赖于数据集，CAMELYON16数据集上的可解释性受到影响，而TUPAC16数据集上则不受影响。这强调了采样与性能和可解释性的关系与任务密切相关。使用1024个样本进行端到端训练可以在两个数据集上都比使用预提取特征获得更好的结果，进一步突显了这种高效方法的潜力。
作者讲解

目前尚无作者解读视频，你可点击下方【许愿开讲】按钮，许愿作者开讲~
图表
解决问题

本论文试图研究在计算病理学中使用多实例学习（MIL）方法时，不同采样数量对模型性能和可解释性的影响。
关键思路

通过实验发现，在CAMELYON16数据集上使用30%的补丁可以提高1.7%的性能，而在TUPAC16数据集上仅使用8个样本就可以提高3.7%的性能。同时，发现可解释性受数据集影响，CAMELYON16数据集上采样会影响可解释性，而TUPAC16数据集上则不会。最后，使用1024个样本的端到端训练比预先提取特征在两个数据集上都有所提高。
其它亮点

实验设计合理，使用了CAMELYON16和TUPAC16数据集，证明了采样数量对模型性能和可解释性的影响，并提出了一种高效的端到端训练方法。
相关研究

在相关研究中，有一篇名为“Multiple Instance Learning: A Survey of Problem Characteristics and Applications”的综述论文，还有一篇名为“Interpretable Convolutional Neural Networks for Accurate Diagnosis and Spatially Guided Treatment of Gliomas”的论文，都和本论文的研究方向有关。

许愿开讲

PDF

原文

点赞收藏

向作者提问

NEW

分享到Link

提问交流

提交问题，平台邀请作者，轻松获得权威解答～

向作者提问