SVGDreamer: Text Guided SVG Generation with Diffusion Model

简介

最近，文本引导的可扩展矢量图形（SVG）合成在图标设计和素描等领域显示出了潜力。然而，现有的文本到SVG生成方法缺乏可编辑性，并且在视觉质量和结果多样性方面存在困难。为了解决这些限制，我们提出了一种新的文本引导矢量图形合成方法，称为SVGDreamer。SVGDreamer采用了一种语义驱动的图像矢量化（SIVE）过程，使合成分解为前景对象和背景，从而增强了可编辑性。具体而言，SIVE过程引入了基于注意力的原始控制和注意力掩码损失函数，以有效控制和操纵单个元素。此外，我们提出了一种基于矢量化粒子的分数蒸馏（VPSD）方法，以解决现有文本到SVG生成方法中存在的颜色过饱和、矢量基元过度平滑和结果多样性有限等挑战。此外，在VPSD的基础上，我们引入了奖励反馈学习（ReFL）来加速VPSD的收敛并提高美学吸引力。大量实验已经进行，以验证SVGDreamer的有效性，在可编辑性、视觉质量和多样性方面表现优于基线方法。SVGDreamer的代码和演示可以在\href{https://ximinng.github.io/SVGDreamer-project/}{https://ximinng.github.io/SVGDreamer-project/}找到。
作者讲解

目前尚无作者解读视频，你可点击下方【许愿开讲】按钮，许愿作者开讲~
图表
解决问题

提高文本引导下SVG合成的可编辑性、视觉质量和结果多样性。
关键思路

引入基于语义的图像矢量化过程（SIVE）和基于奖励反馈学习（ReFL）的矢量粒子评分蒸馏方法（VPSD），以提高SVG合成的可编辑性、视觉质量和结果多样性。
其它亮点

论文提出了SVGDreamer方法，其中SIVE过程可以将合成分解为前景对象和背景，从而提高可编辑性。VPSD方法可以解决文本引导下SVG合成中的颜色过饱和、矢量基元过度平滑和结果多样性有限等问题。此外，论文还介绍了ReFL方法来加速VPSD的收敛并提高美学吸引力。实验结果表明，SVGDreamer在可编辑性、视觉质量和结果多样性方面优于基线方法。
相关研究

最近的相关研究包括：1）基于GAN的SVG图标合成；2）基于LSTM的SVG图形生成；3）使用图像矢量化技术的图标合成。

SVGDreamer: Text Guided SVG Generation with Diffusion Model

提问交流

提问交流