最近,文本引导的可扩展矢量图形(SVG)合成在图标设计和素描等领域显示出了潜力。然而,现有的文本到SVG生成方法缺乏可编辑性,并且在视觉质量和结果多样性方面存在困难。为了解决这些限制,我们提出了一种新的文本引导矢量图形合成方法,称为SVGDreamer。SVGDreamer采用了一种语义驱动的图像矢量化(SIVE)过程,使合成分解为前景对象和背景,从而增强了可编辑性。具体而言,SIVE过程引入了基于注意力的原始控制和注意力掩码损失函数,以有效控制和操纵单个元素。此外,我们提出了一种基于矢量化粒子的分数蒸馏(VPSD)方法,以解决现有文本到SVG生成方法中存在的颜色过饱和、矢量基元过度平滑和结果多样性有限等挑战。此外,在VPSD的基础上,我们引入了奖励反馈学习(ReFL)来加速VPSD的收敛并提高美学吸引力。大量实验已经进行,以验证SVGDreamer的有效性,在可编辑性、视觉质量和多样性方面表现优于基线方法。SVGDreamer的代码和演示可以在\href{https://ximinng.github.io/SVGDreamer-project/}{https://ximinng.github.io/SVGDreamer-project/}找到。
提问交流