DISTWAR: Fast Differentiable Rendering on Raster-based Rendering Pipelines

2023年12月01日
  • 简介
    不同的可微渲染技术被应用于一类重要的视觉计算应用中,其中将3D场景表示为通过梯度下降从2D图像中训练得到的模型。最近的研究(例如3D高斯喷洒)使用光栅化管道,从这些学习到的3D模型中实现高速的高质量照片级真实图像渲染。这些方法已经被证明非常有前途,为许多重要任务提供了最先进的质量。然而,即使使用强大的GPU,训练模型来表示场景仍然是一项耗时的任务。在本研究中,我们观察到,由于需要处理大量原子操作,训练过程中的梯度计算阶段在GPU上是一个重要的瓶颈。这些原子操作超负荷了L2分区中的原子单元,导致停顿。为了解决这个挑战,我们利用了在梯度计算过程中的观察结果:(1)对于大多数warp,所有线程都以原子方式更新相同的内存位置;(2)warp生成不同数量的原子流量(因为一些线程可能是非活动的)。我们提出了DISTWAR,这是一种基于两个关键思想加速原子操作的软件方法:首先,我们使用寄存器实现SM子核上的warp级线程缩减,以利用warp内原子更新的局部性。其次,我们将原子计算分布在SM的warp级缩减和L2原子单元之间,以增加原子计算的吞吐量。对于许多线程执行对相同内存位置的原子更新的warp,安排在SM上,其余的使用L2原子单元。我们使用现有的warp级基元实现了DISTWAR。我们在广泛使用的基于光栅的可微渲染工作量上评估DISTWAR。我们证明了平均加速比为2.44倍(最高可达5.7倍)。
  • 图表
  • 解决问题
    加速不同iable rendering中的梯度计算阶段,以解决GPU上的原子操作瓶颈问题。
  • 关键思路
    使用DISTWAR软件方法来加速原子操作,包括启用SM子核的warp级线程减少和将原子计算分配到SM和L2原子单元之间进行分布。
  • 其它亮点
    DISTWAR在广泛使用的栅格化不同iable rendering工作负载上实现了2.44倍的平均加速(最高达5.7倍)。
  • 相关研究
    最近的相关研究包括3D高斯点喷涂等不同iable rendering技术的发展。
PDF
原文
点赞 收藏 评论 分享到Link

沙发等你来抢

去评论