本文简要介绍一篇ECCV 2022的Oral论文:Toward Understanding WordArt: Corner-Guided Transformer for Scene Text Recognition. 该论文首次探索了一个新的更具挑战性的任务:艺术文字识别,并构建了一个全部由艺术字图像组成的WordArt数据集。考虑到艺术字的特殊性,如字符形变大、字体复杂多样、字符间连笔与重叠严重等问题,文中引入角点图作为一种鲁棒的表示来捕获字符的结构不变性特征,同时设计了一个字符对比损失函数来隐式地学习每一类字符的共性特征。实验结果表明了该方法在艺术字识别任务中的优越性,同时,在一些模糊和透视文字数据集上也达到了最佳性能。 

论文链接:https://arxiv.org/abs/2208.00438

内容中包含的图片若涉及版权问题,请及时与我们联系删除