- 简介最近,文本引导的可扩展矢量图形(SVG)合成在图标设计和素描等领域显示出了潜力。然而,现有的文本到SVG生成方法缺乏可编辑性,并且在视觉质量和结果多样性方面存在困难。为了解决这些限制,我们提出了一种新的文本引导矢量图形合成方法,称为SVGDreamer。SVGDreamer采用了一种语义驱动的图像矢量化(SIVE)过程,使合成分解为前景对象和背景,从而增强了可编辑性。具体而言,SIVE过程引入了基于注意力的原始控制和注意力掩码损失函数,以有效控制和操纵单个元素。此外,我们提出了一种基于矢量化粒子的分数蒸馏(VPSD)方法,以解决现有文本到SVG生成方法中存在的颜色过饱和、矢量基元过度平滑和结果多样性有限等挑战。此外,在VPSD的基础上,我们引入了奖励反馈学习(ReFL)来加速VPSD的收敛并提高美学吸引力。大量实验已经进行,以验证SVGDreamer的有效性,在可编辑性、视觉质量和多样性方面表现优于基线方法。SVGDreamer的代码和演示可以在\href{https://ximinng.github.io/SVGDreamer-project/}{https://ximinng.github.io/SVGDreamer-project/}找到。
- 图表
- 解决问题提高文本引导下SVG合成的可编辑性、视觉质量和结果多样性。
- 关键思路引入基于语义的图像矢量化过程(SIVE)和基于奖励反馈学习(ReFL)的矢量粒子评分蒸馏方法(VPSD),以提高SVG合成的可编辑性、视觉质量和结果多样性。
- 其它亮点论文提出了SVGDreamer方法,其中SIVE过程可以将合成分解为前景对象和背景,从而提高可编辑性。VPSD方法可以解决文本引导下SVG合成中的颜色过饱和、矢量基元过度平滑和结果多样性有限等问题。此外,论文还介绍了ReFL方法来加速VPSD的收敛并提高美学吸引力。实验结果表明,SVGDreamer在可编辑性、视觉质量和结果多样性方面优于基线方法。
- 最近的相关研究包括:1)基于GAN的SVG图标合成;2)基于LSTM的SVG图形生成;3)使用图像矢量化技术的图标合成。
沙发等你来抢
去评论
评论
沙发等你来抢