OCR(光学字符识别)是是指对文本资料的图像文件进行分析识别处理,获取文字及版面信息的过程。目前,这项技术在拍照搜题、拍照翻译等应用中得到广泛使用。最近开发者开发了支持40多种语言的OCR库:EasyOCR。该OCR库使用深度神经网络构建而成:CNN+LSTM+CTC loss,包含三个解码器可选项:贪心搜索、束搜索和词束搜索(word-beam search)。据介绍,Easy OCR的性能可与商业API解决方案媲美,且已开源,支持本地运行,因此适合关注数据隐私和适应性的人使用。作者表示:与标准的开源OCR工具Tesseract相比,Easy OCR的准确率更高,不过速度稍慢。
内容中包含的图片若涉及版权问题,请及时与我们联系删除
评论
沙发等你来抢