对于许多成长于世纪之交的中国青少年来说,远在美国西雅图的比尔盖茨与之赖以声名鹊起的Windows是一个传奇。在他们所阅读的名人传记中,比尔盖茨13岁在湖畔中学编写计算机程序、从哈佛辍学创业的故事,就像90后一代对于乔布斯辍学、在自家车库后院创立苹果公司一样熟悉。

出生于1989年的陈启峰也是其中一员。当时,他正在广东省中山市三乡镇读小学,从小展示出过人的数学天赋,小学五年级与六年级学生同台竞技,在全国奥数竞赛上获得一等奖。在一次阅读比尔盖茨传记的过程中,比尔盖茨创立微软的故事改变了他的竞赛轨迹:钻研信息学。

“我当时觉得,未来一定是信息时代。”陈启峰说道。这种力争走在前沿的思想,不仅一次影响了他的人生选择。2010年,他在密歇根大学安娜堡分校交换时,无意中选修了Silvio Savarese的一门计算机视觉课程,被视觉研究的魅力折服,直觉这个方向有很大的发展潜力,于是立志将其作为未来的研究目标。

2017年,陈启峰在ICCV上发表“Photographic Image Synthesis with Cascaded Refinement Networks”(《级联优化网络生成逼真图像》)一文,只用到一个端到端的神经网络,给出一个语义布局图,就能够生成对应的百万级像素图像,在计算机视觉领域掀起了一番风浪:

以往的图像生成主要是基于GAN形成,陈启峰的方法更为简单。康奈尔大学计算机系的副教授Noah Snavely感慨,陈启峰的系统生成了他见过的最大、最细致的人工场景。这项技术可以用在游戏、电影、VR与AR等领域,他的合作者后来还通过改进,成功还原出《侠盗猎车5》里的情景

计算机视觉的强大,不仅在于感知,还在于生成。从斯坦福博士毕业、加入港科大后,陈启峰继续从事AI成像技术与内容创作的研究。他一直憧憬,在“人人都可以成为主播”的时代,普通人只需要描述一段文字,就可以用人工智能技术生成他们脑海里的画面,“把梦境变成现实”。

完整内容可以戳原文。

内容中包含的图片若涉及版权问题,请及时与我们联系删除