论文地址:https://arxiv.org/pdf/2203.05898.pdf
开源代码:https://github.com/MinaGhadimiAtigh/HyperbolicImageSegmentation
摘要
对于图像分割,当前标准是通过线性超平面进行像素级优化和欧几里得输出嵌入空间的推断。在这项工作中,我们表明双曲线歧管为图像分割提供了有价值的替代方法,并提出了双曲线空间中层次像素级分类的可拖动公式。双曲图像分割为分割开辟了新的可能性和实际好处,例如自由,零标签泛化的不确定性估计和边界信息,以及在低维输出嵌入中的性能提高。
主要贡献
我们执行许多分析,以展示双曲图像分割带来的效果和新的可能性。我们提供以下内容:(i)双曲线嵌入提供了自然措施,以进行不确定性估计和图像分割中的语义边界估计,请参见图1.与贝叶斯的不确定性估计不同,我们的方法不需要其他参数或多个正向通行证,即此信息到了。(ii):具有分层知识的双曲线嵌入比欧几里得对应物提供了更好的零标签概括,即夸张改善了与看不见类别的推理。 (iii):优选的嵌入嵌入尺寸更少。低维有效性是双曲深度学习的基石[29]。我们发现这些好处扩展到图像分割,并具有解释性和设备分割的潜力[3]。我们认为这些发现带来了新的见解和机会来形象细分。
实验
对于所有实验,我们将DeepLabV3+与Resnet101骨架[10]一起使用。我们将Cocostuff-10k,ADE20K和Pascal VOC的学习率初始化为0.001、0.001和0.01。我们以批次大小为5,训练世代分别为70,140,40,在COCO-stuff-10K,ADE20K和Pascal VOC数据集上训练模型。为了优化欧几里得参数,我们使用SGD,动量为0.9,多项式学习率衰减,功率为0.9,类似于[10]。为了优化双曲线参数,我们使用RSGD,类似于[18]。
内容中包含的图片若涉及版权问题,请及时与我们联系删除
评论
沙发等你来抢