Semi-supervised Concept Bottleneck Models

2024年06月27日
  • 简介
    CBM模型因其能够使用人类概念提供基于概念的解释,同时实现高精度预测,而受到越来越多的关注。然而,当前CBM的训练严重依赖于数据集中注释概念的准确性和丰富性。这些概念标签通常由专家提供,这可能需要巨大的资源和努力成本。此外,概念显著性图经常与输入显著性图错位,导致概念预测对应于不相关的输入特征,这与注释对齐有关的问题。为了解决这些限制,我们提出了一个新的框架,称为SSCBM(半监督概念瓶颈模型)。我们的SSCBM适用于注释数据稀缺的实际情况。通过联合训练标记和未标记数据,并在概念级别上对未标记数据进行对齐,我们有效地解决了这些问题。我们提出了一种生成伪标签和对齐损失的策略。实验证明,我们的SSCBM既有效又高效。在仅有20%的标记数据的情况下,我们实现了93.19%(在完全监督设置下为96.39%)的概念准确度和75.51%(在完全监督设置下为79.82%)的预测准确度。
  • 图表
  • 解决问题
    本文旨在解决Concept Bottleneck Models (CBMs)的训练过程中,对数据集中标注的概念的准确性和丰富性依赖性较高的问题,并提出了一种半监督的CBM框架(SSCBM)。
  • 关键思路
    SSCBM框架通过在标注和未标注数据上进行联合训练,并在概念层面上对齐未标注数据,解决了标注不足和注释对齐不准确的问题。
  • 其它亮点
    实验结果表明,使用SSCBM框架在仅有20%的标注数据的情况下,可以达到93.19%的概念准确度和75.51%的预测准确度。该论文的亮点在于提出了一种半监督的CBM框架,可以在标注数据不足的情况下训练模型,并解决了标注和注释对齐的问题。
  • 相关研究
    近期的相关研究包括:1)Concept Bottleneck Models for Explainable Deep Learning,2)Learning Concept-Based Explanations in Medical Diagnosis,3)Interpretable Convolutional Neural Networks via Feedforward Design等。
PDF
原文
点赞 收藏 评论 分享到Link

沙发等你来抢

去评论