作者:叶小飞

作为一个在工业界做了三年CV的工程师和OPPO Reno初代超级夜景核心研发人员之一,我认为CV业界的行情可以用一句话概括:初学者遍地皆是,资深者企业难寻。 CV卷吗?很卷,如果你只是一个上过几门网课,做过几个学校项目就想进入该领域的初学者,或者你是一个入行几年,但是skillset停滞不前的工程师,那么你可能将会被卷得面目全非。CV卷吗?其实也没有到万径人踪灭的地步。对于那些已经入行数年,对方向把握较好,拥有全栈技能的工程师或者有着扎实基本功、一定实习/学术经验和对前沿算法有持续追踪的毕业生而言,在工业界里一定会有一席之地。所以想在CV这行混得风生水起,做出些成就,绝对是有迹可循的。 在这个回答里,我想讲一下CV内卷的原因、从业者怎样才能在卷中生存 以及 我看好的CV/ML未來发展方向。

CV内卷的原因 任何一个行业内卷严重的根本原因都只有一个:狼多肉少。首先大家为什么都挤破脑袋想做CV呢?无非三个原因,第一,CV岗位的薪资确实可观。第二,CV岗位本身比一般的码农职位要有意思,有着浓烈的未来感。第三,CV在深度学习催化下门槛变低,受过一点训练的高中生都能在一小时里跑起一个Yolo做目标检测。很多人都会忽略,CV入门简单,但是做到高阶水准很难。 那么为什么岗位数量有限呢?我认为最根本的原因是CV本身给公司带来的直接利润有限。它更多时候是作为一个噱头,而不是主打。比如短视频平台虽然涉及大量人脸相关的CV技术,但是它赚钱的核心还是来基于内容推荐与用户互动。换句话说,如果CV就像普通的代码一样成为企业盈利必不可少的基石,那么我认为bar一定会大大降低。当然了,CV对无人汽车的确是刚需,但是别忘了,无人汽车现在本身就是在烧钱的状态啊!

从业者的出路 对于非博士学位的CV工程师来讲,最重要的核心技能一定是工程落地能力。算法再花哨,再state of the art, 如果不能落地,那么对公司来说价值就十分有限。很多算法落地的流程都是Python prototyping + C++ 部署模型,所以对C++的熟练掌握是非常重要的。部署模型时往往需要工程师对原始模型要先进行一系列优化(例如剪枝、蒸馏和量化),所以这就要求工程师对算法本身也要有较好的理解,要做到这一点,必然少不了扎实的数学基本功,和对前沿论文的实时追踪。最后还有一点非常重要却容易被工程师疏忽,那就是学会有效地和上级沟通,能够适时大胆地表现自己,很多事你不去讲,没有人会给予你特别的关注,一个会做演讲的工程师绝对不会混的太差。

在这里再总结一下我认为一流CV工程师应该具备的重要素养: * 优异的Python与C++编程能力 * 对自己所接触的相关算法有透彻的理解 * 对前沿论文的追踪 * 不错的应用数学基础 * 良好的沟通、表现,演讲能力

CV/ML未来几年潜力方向 把这两个领域放在一起说,是因为它们俩其实是不分家的。随着5G时代的到来和短视频的兴起,在去年2月份时短视频月活已经超过了8亿,所以几乎可以用脚断定,最近几年国内各大巨头必定对视频理解、视频质量增强、视频压缩等视频方向继续加大研发投资,开始又一轮的竞赛。而对于之前大热的类似超级夜景这种图像质量增强、还有人脸识别等与face 相关的领域会到达瓶颈期,趋于成熟,各大巨头基本已经形成技术垄断。所以对于那些想入坑CV的新人或者想跳槽的有经验的工程师来说,选择视频方向不会有错。 而机器学习最近大火的一个方向是机器学习系统,我尤其看好联邦学习这个方向。除了去年NIPS上这方面的论文数量暴增之外,联邦学习良好的隐私性与可大规模分布性本身就是符合这个大数据时代的潮流的。除了联邦学习,AutoML 也会进一步完善合,各大公司也会开始在这一领域猛砸研发投资。由于联邦学习与AutoML还处于半成型阶段,这两个领域有着巨大的潜力可以挖掘,无论是学者还是工程师,在2021年开始入场两个领域可以有机会占得先机。

总结 其实对于CV领域从业者来说,我觉得最重要的永远是一个人的热爱, 祝愿在座的各位(包括我自己)在卷得面目全非之际,仍能不忘初心、保持一颗充满激情与斗志之心!

内容中包含的图片若涉及版权问题,请及时与我们联系删除