百度的OCR开源项目PaddleOCR自去年6月开源以来,累计Star数量已超过8.5K,并且登上Github Trending 日榜月榜:

  • 6月,8.6M超轻量模型发布,GitHub Trending 全球趋势榜日榜第一。
  • 8月,开源CVPR2020顶会SOTA算法,再上GitHub趋势榜单!
  • 10月,发布PP-OCR算法,开源3.5M超超轻量模型,再下Paperswithcode 趋势榜第一

最近,其又带来四大新发布与升级:

  • 全新发布数据合成工具Style-Text:可以批量合成大量与目标场景类似的图像,在多个场景验证,效果均提升15%以上。
  • 全新发布半自动数据标注工具PPOCRLabel:有了它数据标注工作事半功倍,相比labelimg标注效率提升60%以上,社区小规模测试,好评如潮。
  • 多语言识别模型效果升级:在开源测试集评估,中文、英文、韩语、法语、德语、日文识别效果均优于EasyOCR。
  • PP-OCR开发体验再升级:支持动态图开发(训练调试更方便),静态图部署(预测效率更高),鱼与熊掌可以兼得。

有需要的小伙伴可以戳链接:https://github.com/PaddlePaddle/PaddleOCR

3.5M超超轻量模型的效果图

内容中包含的图片若涉及版权问题,请及时与我们联系删除