EasyOCR：支持40+种语言和本地运行的OCR库

OCR（光学字符识别）是是指对文本资料的图像文件进行分析识别处理，获取文字及版面信息的过程。目前，这项技术在拍照搜题、拍照翻译等应用中得到广泛使用。最近开发者开发了支持40多种语言的OCR库：EasyOCR。该OCR库使用深度神经网络构建而成：CNN+LSTM+CTC loss，包含三个解码器可选项：贪心搜索、束搜索和词束搜索（word-beam search）。据介绍，Easy OCR的性能可与商业API解决方案媲美，且已开源，支持本地运行，因此适合关注数据隐私和适应性的人使用。作者表示：与标准的开源OCR工具Tesseract相比，Easy OCR的准确率更高，不过速度稍慢。

内容中包含的图片若涉及版权问题，请及时与我们联系删除

EasyOCR：支持40+种语言和本地运行的OCR库

评论列表

评论