论文链接:

https://arxiv.org/abs/2104.03964

本文简要介绍ICCV 2021录用论文“Handwriting Transformers”的主要工作。该工作针对手写文字生成任务,提出同时学习风格-内容纠缠、以及书写者的全局与局部书写风格来进行手写文字的生成工作。具体地,本文提出一种基于Transformer的手写文本图像生成方法,通过自注意力机制捕捉局部以及全局的风格属性,利用编码器-解码器注意力机制,通过推断每个查询字符的风格表示,在字符级别实现风格内容嵌入,可以生成具有不同长度和任何所需书写风格的真实风格的手写文本图像。该方法是第一个提出基于Transformer来做手写文本风格合成的工作。

该方法的整体框架结构如上图所示,主要包含了4部分内容:1)合成网络G用于生成手写文本图像;2)鉴别器D用于判断生成数据的真实性;3)识别器R用于辅助文本的保留;4)风格分类器用于控制合成图像的风格。

内容中包含的图片若涉及版权问题,请及时与我们联系删除