近日,中信出版社出版了2018 年图灵奖获得者、「卷积神经网络之父」 Yann LeCun🪪 自传——《科学之路》。对于关注人工智能行业发展的读者而言,该书讲述了 Yann LeCun 如何从学生走向贝尔实验室、Facebook,逐渐成长为深度学习泰斗。作为当代最伟大的人工智能科学家之一,Yann LeCun 在此书的最后畅想了人工智能研究的前景与挑战,并严谨地指出了该领域研究的隐忧和未来趋势。

图:Yann LeCun 自传《科学之路》

作为国内人工智能的领军学者,智源研究院理事长 张宏江🪪博士为《科学之路》作序,提出「所有努力都是为了提升概率」的观点,这也正是北京智源人工智能研究院的初心和目的,希望我们的努力能让中国出现突破性成果的概率增加。


所有努力都是为了提升概率

撰文:张宏江🪪 智源研究院理事长

国际象棋大师加里·卡斯帕罗夫(Garry Kasparov)曾这样总结自己的常胜秘诀,“我并非根据棋局结果考虑如何调整落子,而是从系统角度,思索怎样改进自己思考的方式”。作为将人工智能带入崭新时代的先锋,杨立昆在《科学之路》中,详细记录了他对人工智能过去和未来的探索与思考;而同样重要的是,他深刻剖析了关于如何做出推进人类社会大幅向前发展的研究背后的系统与规律。

历史上多数研究成果的出现是偶然事件,没人能规划出来,所有努力都是为了提升概率——汇聚优秀的研究人员,为他们提供能够碰撞思想、发现问题、寻找协作伙伴的社区环境,对这些“人”而非“项目”进行资助,让他们能站在未来思考重要的问题,随着时间的推移,通常结果就会显现。

青年时代杨立昆在欧洲的研究之路,就像一次孤立无援的远征。他的本科专业是电气工程,导师对他关注的话题几乎一无所知。毕业后,他只能在法国的一个小实验室继续研究,同样由一位“外行”教授指导,但他还是获得了研究需要的资源。指导教授告诉他:“我不知道你在做什么,但你看上去是一个很聪明勤奋的人,所以我会签署这些文件。”

转折发生在1985年春天,在阿尔卑斯山麓举办的研讨会上,杨立昆遇见了贝尔实验室新成立的神经网络研究小组,三年后,被该小组聘用并移居美国。他还遇见了特伦斯·谢诺夫斯基,并通过他与杰弗里·辛顿结缘。这次会议将一小群研究人员集结在一起,他们将形成一个紧密联系的社区,创建新的人工智能模型。

做非渐进性的研究,需要将研究人员“置于未来”。在计算机领域,方法之一是提供强大的计算能力,让研究人员可以用简便的方式、无须经过特殊优化的手段来重复尝试和探索,还能让他们在尝试新想法时,避开“过于实用”的陷阱。就如杨立昆提到,在贝尔实验室,曾有人告诉他“靠节省开支是无法混出名堂的”。刚到实验室,他就独自拥有一台Sun 4计算机;而此前在多伦多,同样一台计算机则由40个人共用。在贝尔实验室,做数字识别研究,他可以使用美国邮政近万张真实手写图像;作为对比,之前他只能利用一个很小的手工数据集来测试卷积网络。入职两个月,他就创造了以自己名字命名的LeNet,在数字识别方面创造了纪录。

常规的同行评审往往“过于合理”,以至颠覆性的研究很难找到真正的同行。对于“不合理”的方向,方向内的“小同行”更有发言权,而且他们知道谁是最优秀的人。

即使到2006年,参与评审杨立昆论文的人工智能同行也对他并不宽容。因为彼时的深度学习,还是一个不受重视的小方向,杨立昆2004—2006年关于这个方向的文章,几乎被最重要的学术会议——ICML(国际机器学习大会)、NeurIPS、CVPR、ICCV(国际计算机视觉大会)等都拒绝了。

2006年之后,随着他们的人际圈逐渐扩大,审阅专家才普遍开始支持他们的工作。不过即便这样,2007年在向NeurIPS组织者提出举办一个深度学习研讨会时,还是被否决了。还好他们有CIFAR(加拿大高等研究院)提供的资金,“私设”了一个研讨会,有300多位参与者,成了那年NeurIPS上最受欢迎的研讨会。

黄金时代的工业实验室曾是变革性技术最重要的发源地,例如杨立昆工作与实习过的贝尔实验室和施乐帕克研究中心(Xerox PARC)。而如今,虽然这些工业实验室仍然存在,却不再像20世纪中叶那样有效。仔细观察你会发现,黄金时代的工业实验室需要的条件,今天不容易复制,例如,几乎占据垄断的行业地位、前沿研究主要依靠内部完成、研究可以高效地为企业创造利润等。

杨立昆在贝尔实验室辉煌的末期加入,1995年经历了AT&T(美国电话电报公司)对公司的一次拆分;1996年,作为部门负责人,他不得不寻找“实用”的新方向,长达5年的时间里,他基本没有再涉足机器学习研究。2001年年底,AT&T再次被拆分,裁去一半研究人员。好在他提前在NEC(日本电气股份有限公司)普林斯顿实验室谋得了一个职位。然而一年后,NEC遇到经济危机,开始给实验室施压,也逼迫实验室转向更容易落地和变现的应用。

那次人工智能寒冬持续了10年,幸运的是,DARPA(美国高级研究计划局)和CIFAR对杨立昆等人的想法感兴趣,分别提供了多年支持,让这群人仍能聚集在一起。这些人利用资助组织讲习班,为学生们开辟了一个科学小天地。

今天的“创新生态系统”主体由以下这些部分组成:学术界擅长产生新想法,初创企业擅长将高潜力产品推向新市场,企业研发在改善现有产品方面无与伦比。但组成这个系统的机构差异很大,每个机构的体制都有限制因素。杨立昆也描述了他在脸书挑战这些限制所做的努力。

智源研究院希望通过构筑协作社区,打造用于未来研究的计算和数据平台;同时,集结最优秀的小同行,专注未来可能产生原始创新与长期影响的领域(包括过往投入不足、重视不够的领域)等一系列机制,让创新系统更高效地运行。正如我一开始所提到的,所有努力都是为了提升概率,希望我们的努力能让中国出现突破性成果的概率增加,希望本书读者亦能加入我们的行列。

2021年7月于北京