论文标题: PP-OCRv2: Bag of Tricks for Ultra Lightweight OCR System 

论文链接:https://arxiv.org/abs/2109.03144

代码链接:https://github.com/PaddlePaddle/PaddleOCR

作者单位:百度

光学字符识别 (OCR) 系统已广泛应用于各种应用场景。设计 OCR 系统仍然是一项具有挑战性的任务。在之前的工作中,我们提出了一种实用的超轻量级 OCR 系统(PPOCR)来平衡精度和效率。为了提高 PP-OCR 的准确性并保持高效率,本文提出了一种更鲁棒的 OCR 系统,即 PPOCRv2。我们介绍了一系列技巧来训练更好的文本检测器和更好的文本识别器,其中包括协作互学习 (CML)、复制粘贴、轻量​​级 CPU 网络 (LCNet)、统一深度互学习 (U-DML) 和增强型 CTCLoss。在真实数据上的实验表明,在相同的推理成本下,PP-OCRv2 ​​的精度比 PP-OCR 高 7%。它也可以与使用 ResNet 系列作为主干的 PP-OCR 的服务器模型相媲美。上述所有模型都是开源的,代码可在由 PaddlePaddle 2 提供支持的 GitHub 存储库PaddleOCR 1 中找到。

内容中包含的图片若涉及版权问题,请及时与我们联系删除