论文标题:Total Variation Optimization Layers for Computer Vision
论文连接:https://arxiv.org/abs/2204.03643
代码链接:https://github.com/raymondyeh07/tv_layers_for_cv
作者单位:丰田工业大学 & UIUC
深度网络层内的优化已成为深度网络层设计的新方向。 然而,将这些层应用于计算机视觉任务时存在两个主要挑战:(a)层内的哪个优化问题有用? (b) 如何确保层内的计算保持高效? 为了研究问题 (a),在这项工作中,我们建议将总变异 (TV) 最小化作为计算机视觉的一个层。 受图像处理整体变化成功的启发,我们假设 TV 作为一个层也为深度网络提供了有用的归纳偏置。 我们在五个计算机视觉任务上研究了这一假设:图像分类、弱监督对象定位、边缘保持平滑、边缘检测和图像去噪,改进了现有的基线。 为了实现这些结果,我们必须解决问题 (b):我们开发了一种基于 GPU 的投影牛顿法,它比现有解决方案快 37 倍。
内容中包含的图片若涉及版权问题,请及时与我们联系删除
评论
沙发等你来抢