Optimization for Medical Image Segmentation: Theory and Practice when evaluating with Dice Score or Jaccard Index
论文链接:https://arxiv.org/abs/2010.13499
本文在六种医学分割任务的广泛实验中证明,在使用Dice或Jaccard系数进行评估的情况下,度量敏感的损失要优于基于交叉熵的损失函数,作者单位:鲁汶大学, UZ Leuven
在许多医学成像和经典计算机视觉任务中,使用Dice score和Jaccard index来评估分割性能。尽管存在度量敏感性损失并在经验上取得了巨大成功,例如soft Dice, soft Jaccard and Lovasz-Softmax之类的度量标准,但许多研究人员仍然使用每像素损失,例如(加权)交叉熵来训练CNN进行分割。因此,目标指标在许多情况下并未直接优化。我们从理论角度研究度量敏感损失函数组之间的关系,并质疑是否存在针对加权交叉熵的最佳加权方案,以在测试时优化Dice得分和Jaccard指数。我们发现Dice分数和Jaccard指数相对且绝对地彼此近似,但是对于加权汉明相似度,我们找不到这种近似。对于Tversky损失,当偏离琐碎的权重设置(软Tversky等于软Dice)时,逼近度单调变差。我们在对六种医学分割任务的广泛验证中以经验方式验证了这些结果,并且可以确定在使用Dice得分或Jaccard指数进行评估的情况下,度量敏感的损失要优于基于交叉熵的损失函数。这进一步适用于多类设置,并且适用于不同的对象大小和前景/背景比率。这些结果鼓励将度量敏感的损失函数更广泛地用于医疗分割任务,其中关注的绩效指标是Dice得分或Jaccard指数。
内容中包含的图片若涉及版权问题,请及时与我们联系删除
评论
沙发等你来抢