- 简介在低光环境下定位文本是具有挑战性的,因为会出现视觉退化。虽然一个简单的解决方案是使用低光图像增强 (LLE) 作为初始步骤,然后再使用检测器,但是 LLE 主要是为人类视觉而设计的,而不是为机器视觉,可能会积累误差。在本文中,我们提出了一种高效而有效的单阶段方法,用于在黑暗中定位文本,避免了对 LLE 的需求。我们在文本检测器的训练阶段引入了一个约束学习模块作为辅助机制。该模块的设计目的是在特征图调整大小时引导文本检测器保留文本空间特征,从而最小化低光视觉退化下文本空间信息的损失。具体而言,我们在该模块中结合了空间重建和空间语义约束,以确保文本检测器获得必要的位置和上下文范围知识。我们的方法通过使用动态蛇特征金字塔网络增强了原始文本检测器识别文本局部拓扑特征的能力,并采用了一种新的矩形积累技术的自下而上轮廓塑形策略,以精确描绘流线型文本特征。此外,我们还提供了一个包含各种场景和语言的任意形状文本的全面低光数据集。值得注意的是,我们的方法在这个低光数据集上取得了最先进的结果,并在标准的正常光数据集上展现了可比较的性能。我们将发布代码和数据集。
- 图表
- 解决问题本论文旨在解决在低光环境下文本定位的问题,提出了一种单阶段的解决方案,避免了低光图像增强(LLE)的需求。
- 关键思路论文提出了一种约束学习模块作为文本检测器训练阶段的辅助机制,以在特征图调整的同时保留文本空间特征,从而最小化低光条件下文本空间信息的丢失。
- 其它亮点论文采用动态蛇特征金字塔网络增强文本检测器的能力,采用底部轮廓塑形策略和新颖的矩形累积技术进行精确的文本特征描述。同时,论文提出了一个全面的低光数据集,包括各种场景和语言。实验结果表明,该方法在低光数据集上达到了state-of-the-art的效果,并在标准正常光数据集上表现出可比较的性能。
- 近期的相关研究包括:'Towards End-to-End Text Spotting with Convolutional Recurrent Neural Networks','FOTS: Fast Oriented Text Spotting with a Unified Network','TextBoxes: A Fast Text Detector with a Single Deep Neural Network'等。
沙发等你来抢
去评论
评论
沙发等你来抢