LEAST: "Local" text-conditioned image style transfer

2024年05月25日
  • 简介
    文本条件下的风格转移使用户能够通过文本描述来传达他们所期望的艺术风格,提供了一种新的、富有表现力的实现风格化的方式。在这项工作中,我们评估了文本条件下的图像编辑和风格转移技术对用户提示的精细理解,以实现精确的“局部”风格转移。我们发现目前的方法未能有效地实现局部风格转移,要么未能将风格转移定位到图像中的某些区域,要么扭曲了输入图像的内容和结构。为此,我们精心设计了一个端到端的流程,保证根据用户意图进行局部风格转移。此外,我们通过定量和定性分析证实了我们方法的有效性。项目代码可在以下网址获得:https://github.com/silky1708/local-style-transfer。
  • 图表
  • 解决问题
    本论文的问题是评估文本条件下的图像编辑和风格转移技术对于用户提示的精细理解,特别是在本地风格转移方面的表现。论文发现当前方法在有效地实现本地风格转移方面存在问题,要么无法将风格转移定位到图像的某些区域,要么会失真图像的内容和结构。
  • 关键思路
    本论文提出了一种端到端的管道设计,可以根据用户的意图保证本地风格转移,解决了当前方法存在的问题。该方法的关键思路是将图像分割成多个区域,并根据用户提供的文本描述针对每个区域进行风格转移。
  • 其它亮点
    本论文的亮点是提出了一种有效的本地风格转移方法,并通过定量和定性分析证明了该方法的有效性。论文使用了多个数据集进行实验,并公开了项目代码。
  • 相关研究
    最近的相关研究包括:1)基于深度学习的图像风格转移方法,如Gatys等人的方法;2)基于文本描述的图像生成方法,如Reed等人的方法;3)将文本嵌入到图像风格转移中的方法,如Huang等人的方法。
PDF
原文
点赞 收藏 评论 分享到Link

沙发等你来抢

去评论