最近,PaddleOCR 项目迎来更新,发布了最新的 PP-OCR,又一次在 OCR 方向引起了大家的关注。

从效果上看,PP-OCRv2 主要有三个方面提升:
  • 在模型效果上,相对于 PP-OCR mobile 版本提升超 7%;

  • 在速度上,相对于 PP-OCR server 版本提升超过 220%;

  • 在模型大小上,11.6M 的总大小,服务器端和移动端都可以轻松部署。

全新升级的 PP-OCRv2 版本,整体框架图保持了与 PP-OCR 相同的 Pipeline,如下图所示:

在优化策略方面,主要从五个角度进行了深入优化(如上图红框所示),主要包括:
检测部分优化两项:
  • 采用协同互学习(Collaborative Mutual Learning, CML) 知识蒸馏策略

  • CopyPaste 数据增广策略

识别部分优化三项:

  • LCNet 轻量级骨干网络(Lightweight CPU Network)

  • UDML 知识蒸馏策略

  • Enhanced CTC loss 改进

内容中包含的图片若涉及版权问题,请及时与我们联系删除