作者:Harlon 编辑:钰莹
随着人工智能的热度上升,图像识别这一细分领域也渐渐被人们所关注。在很多公司的业务中,有很多需要对图片进行识别的需求。为了帮助业务实现对这些图片、文档的识别和结构化,业界进行了一系列的实践和探索,最终确定了一些可行的方法。实践过程中,可能遇到过一系列问题和难点。本次分享,作者将结合目前的业务需求,说说爱奇艺在探索中遇到的痛点和难点以及识别技术中的一些细节。
具体包括以下几个问题:
- InfoQ:您好,非常开心有机会采访您,您方便简单介绍下过去几年 OCR 技术的整体发展吗?大致可以从哪几个维度来看?
- InfoQ:您方便聊聊目前 OCR 技术在工业界的主流应用有哪些?技术层面还存在哪些瓶颈?
- InfoQ:过去一年,OCR 领域也出现了不少开源项目,对开发者选型而言,您认为可以从哪几个层面考虑?
- InfoQ:Paddle OCR 也是一个非常轻量级的框架,实现这样一个框架的难度大概是什么?
- InfoQ:您方便介绍下爱奇艺内部主要有哪些场景应用到了 OCR 技术?用来解决哪些问题?
- InfoQ:您方便聊聊爱奇艺是什么时候开始打造 OCR 技术体系的?到现在经过了哪些阶段,有哪些重要的时间节点?每个阶段主要用于解决哪些问题?
- InfoQ:在这个过程中,爱奇艺主要用到了哪些算法和模型?效果如何?
- InfoQ:我们都知道,识别率是衡量 OCR 识别是否精准的重要条件,你们是如何提升识别率的?其中的难点是什么?目前的准确率是多少?
- InfoQ:接下来,爱奇艺还将做哪些事情提高 OCR 技术的整体效果?
以及QA部分:
- 端到端的 OCR 框架有哪些注意事项?有什么可以参考的吗?
- 对于添加了水印或印章的图片,是否有比较好的识别方式?
- east 文本监测的优缺点有哪些?
- 方便分享下模糊文本的识别吗?
- 从 0 到 1 搭建 OCR 有哪些坑可以绕开?
嘉宾介绍:Harlon,爱奇艺智能平台部助理研究员,来自爱奇艺智能平台部 AI 服务组,从事 OCR 算法、视频内容分析、智能审核等研发工作。
感兴趣的可以继续戳原文。
内容中包含的图片若涉及版权问题,请及时与我们联系删除
评论
沙发等你来抢