OCR开源神器PaddleOCR再升级:效果提升7%、速度增加220%

项目

CV

论文

吴继芳 2021-10-17 13:59 分享

以下文章来源于mp.weixin.qq.com

最近，PaddleOCR 项目迎来更新，发布了最新的 PP-OCR，又一次在 OCR 方向引起了大家的关注。

论文地址：https://arxiv.org/abs/2109.03144
项目地址：https://github.com/PaddlePaddle/PaddleOCR

从效果上看，PP-OCRv2 主要有三个方面提升：

在模型效果上，相对于 PP-OCR mobile 版本提升超 7%；
在速度上，相对于 PP-OCR server 版本提升超过 220%；
在模型大小上，11.6M 的总大小，服务器端和移动端都可以轻松部署。

全新升级的 PP-OCRv2 版本，整体框架图保持了与 PP-OCR 相同的 Pipeline，如下图所示：

在优化策略方面，主要从五个角度进行了深入优化（如上图红框所示），主要包括：

检测部分优化两项：

采用协同互学习（Collaborative Mutual Learning, CML) 知识蒸馏策略
CopyPaste 数据增广策略

识别部分优化三项：

LCNet 轻量级骨干网络（Lightweight CPU Network）
UDML 知识蒸馏策略
Enhanced CTC loss 改进

内容中包含的图片若涉及版权问题，请及时与我们联系删除

点赞收藏评论分享到Link

评论列表

沙发等你来抢

去评论