Flow Score Distillation for Diverse Text-to-3D Generation

简介

最近，文本转三维生成方面取得了显著进展，特别是通过依赖于分数蒸馏抽样（SDS）的方法。虽然SDS表现出创建令人印象深刻的三维资产的能力，但它受其固有的最大似然寻求本质的限制，导致生成结果的多样性受限。在本文中，我们发现去噪扩散隐式模型（DDIM）生成过程（即PF-ODE）可以用SDS损失的类比简洁地表达。更进一步，可以将SDS视为广义的DDIM生成过程。根据这一认识，我们展示了噪声添加阶段中的噪声抽样策略显著限制了生成结果的多样性。为了解决这个限制，我们提出了一种创新的噪声抽样方法，并介绍了一种新的文本到三维方法，称为Flow Score Distillation（FSD）。我们在各种文本到图像扩散模型的验证实验中表明，FSD显著增强了生成的多样性，而不会影响质量。
作者讲解

目前尚无作者解读视频，你可点击下方【许愿开讲】按钮，许愿作者开讲~
图表
解决问题

本论文旨在解决Score Distillation Sampling (SDS)方法在生成3D模型时存在的多样性不足的问题。
关键思路

论文提出了一种新的文本到3D模型生成方法Flow Score Distillation (FSD)，通过改进噪声采样策略，提高生成结果的多样性。同时，将SDS视为DDIM生成过程的一种推广。
其它亮点

论文使用了DDIM生成过程（PF-ODE）的一种类似于SDS损失的模拟方法。在此基础上，提出了FSD方法，通过改进噪声采样策略，大幅提高了生成结果的多样性。实验结果表明，FSD在不降低质量的情况下，成功提高了生成结果的多样性。
相关研究

最近的相关研究包括：1.《Implicit 3D Object Representations in the Wild: Geometry-Aware Implicit Shape Completion from a Single View》；2.《Learning to Infer Implicit Surfaces without 3D Supervision》。

Flow Score Distillation for Diverse Text-to-3D Generation

提问交流

提问交流