上个月,AI领域出现了一件关注度极高的事:美国AI大牛、前微软研究员Alex Lamb宣布加入清华大学。

为什么不远万里来到中国执教?Alex Lamb的选择迅速引发了大家的好奇心。

回顾Alex Lamb的研究生涯,可以说贯穿了第三次人工智能浪潮的崛起:他很早就对人工智能产生了浓厚的兴趣,也曾师从图灵奖得主,并在包括亚马逊、Google DeepMind和微软在内的多家美国科技巨头工作过。

2010年,Alex Lamb开始在约翰霍普金斯大学攻读理学学士学位,专业是计算机科学和应用数学与统计学。在此期间,他就对人工智能和大数据在现实世界中的应用产生了浓厚的兴趣。本科毕业后,Alex Lamb2013年加入了亚马逊,成为其核心机器学习团队的一员,参与开发了需求预测的算法。

2015年,Alex Lamb选择去往蒙特利尔大学攻读博士学位,师从深度学习先驱Yoshua Bengio。就在三年后,Yoshua Bengio因其在人工神经网络和深度学习方面的贡献获得了计算机科学领域的最高荣誉——图灵奖。

2021年,Alex加入微软担任高级研究员。这是他入职清华之前的最后一份全职工作。根据谷歌学术(Google Scholar)的数据,Alex Lamb在顶级期刊和学术会议上共发表了 67 篇论文,被引用次数超过 9900 次。

在面试了众多香港等地的高校之后,和姚期智先生的一面之缘让Alex最终坚定了加入清华的想法。据了解,加入清华大学担任助理教授之后,Alex Lamb会负责为清华大学人工智能学院和交叉信息科学研究院招收研究生,培养在机器学习和强化学习领域有志向和兴趣的学生。

Alex Lamb的选择,也反映了当下AI人才流动的新趋势。在全球AI版图重构的浪潮中,中国正以系统性创新生态构筑战略高地,技术突破、数据资源与商业闭环正在生成新的飞轮效应,同时形成人才集聚的「强磁场」。我们完全可以说,中国正在重新定义下一代人工智能的价值转化枢纽与全球人才流动坐标。

67日上午,Alex Lamb出席了2025智源大会「青年科学家发展与创新动能论坛」,与多位来自高校和企业的青年科学家及业界翘楚共同分享领域和学术成长经历。这也是他来到中国之后,首次以「清华大学助理教授」的身份在大型行业会议中发表主旨演讲。


近期,智源社区对Alex Lamb进行了专访。以下是他的分享:

 采访:李梦佳

01

第三次人工智能浪潮的见证者

Q:我们对你的个人学术经历很好奇。在你的人生道路上,哪些作品最能代表你自己?无论是思想还是人,哪些对你产生了深远的影响?

Alex Lamb我想我可以按时间顺序来说。在约翰霍普金斯大学读本科的时候,我开始和Mark Dredze一起研究机器学习。我真的很喜欢这个领域,很喜欢其中的数学,也很享受当时该领域的「野心勃勃」。2011年,企业对机器学习的态度大多认为「不太可能」,但与此同时,他们也开始阅读该领域的一些研究成果。我很幸运地加入了亚马逊的需求预测团队,这家公司给了我充分的自由去探索和做一些研究。

就在那时,我读到了某一篇论文。大概意思是,决策树根本无法实现新的变化(注:决策树容易过拟合,即模型在训练数据上表现得过于完美,以至于在新的、未见过的数据上表现不佳)。那篇论文的研究者进行了相关探索,并发现其确实存在瓶颈,让我重新审视对神经系统的研究。

让我决定改变的还有一篇论文,Pedro Domingos的《Sum-product networks: A new deep architecture》。这篇论文现在来看并不太高明,但它是对深度学习理念的另一种诠释。

我当时在亚马逊,对生成式模型等新方向的研究产生了浓厚兴趣。我希望获得一个博士学位,以便更深入地研究算法。在加拿大的体系中,你必须先开始攻读硕士学位。我联系到了Aaron Courville并开始与他合作。很幸运,他收了我做学生。我也很喜欢在那里工作,陆续发表了一些研究,比如递归神经网络等方向。

Q:哪几个关键转折点可以算作你人生旅途中的里程碑呢?比如你最喜欢的代表作是什么?

Alex Lamb对我来说,最重要的节点之一就是在亚马逊获得研究员职位,尽管那属于我职业生涯的早期,但这个环境让我能够做很多研究,并与当时一些经验丰富的优秀人才共事。

进入蒙特利尔大学之后,我开始和Aaron CourvilleYoshua Bengio还有其他学生一起工作。这可能是我职业生涯的另一个重要转折点。

一个代表作就是《Manifold mixup: Better representations by interpolating hidden states(注:流形混合算法,深度学习中的一种数据增强与正则化技术,它扩展了经典的Mixup方法,通过在神经网络的隐藏层特征空间进行样本插值,提升模型的泛化能力和鲁棒性)。首先,它的效果非常好,而且很多研究人员都使用了它,并取得了进步。关于这一点我很满意。同时,我们还能证明一些关于它的理论,所以我觉得这很酷。

另一个重要阶段是在微软研究院工作的日子。我们证明了一些关于多步逆模型(Multi-Step Inverse Models)的理论,并获得了一些很酷的实验结果,我也为这项工作感到自豪。

Q:你觉得 10 年前的深度学习与现在有什么不同?

Alex Lamb10 年前,我觉得一切都开始沿着工程学改进的道路前进。生成式模型提升得如此之快,这已经很了不起了。我 2015 年开始攻读博士学位时,任何像动物或人脸这样的数据都还几乎不可能生成。

所以我觉得,我的生成模型真的推动了领域的发展。与此同时,由于核心算法变得非常出色,这个领域也吸引了很多非常聪明的工程师和善于实现的人。老实说,我对这个领域的突破或发展路径感到有些惊讶。

Q:在整个研究生涯中,你是否遇到过一些重大挑战?你又是如何克服这些困难并推动研究向前发展的?

Alex Lamb作为一名研究人员,最困难的事情之一就是你必须不断地选择,找到自己,或者做一些新的事情。比方说在工作中,如果你只是成功了然后不停地重复做同一件事,在某些时候,你就会脱离研究,会进入更像工程学的领域。因此,我认为作为一名研究人员,你需要不断重塑自己。你需要强迫自己这样做。

Q:在蒙特利尔的时候,你和Bengio一起工作。你能分享一些和他一起工作的故事吗?

Alex Lamb有件有趣的事情是,当他教授深度学习课程时,他认为这是一种开放的方式。所以他会让班上的学生在线提交问题。然后他会在课上回答这些问题。大家称之为「重生课堂」

这很有趣,因为我试着给他们提过一些疯狂的问题。我记得有一次我的问题是:「梦是什么?what are dreams? 他看着我说:「Alex,我对这些东西很开放,但你现在的问题有点出格了。」总体来说,当时思考新算法、新研究思路的过程是非常有趣的。

Q:你还提过哪些「疯狂的问题」?

Alex Lamb我记得另一件事是,我很喜欢思考生物灵感,尝试思考人类是如何工作的,或者大脑是如何工作的。我认为这是一个相当有趣的研究课题。

Q:在来到中国执教之前,你在很多大公司工作过,比如微软、亚马逊和谷歌大脑。你能分享一下这些经历吗?这些经历有什么不同?又分别给你的研究带来了什么?

Alex Lamb对我来说,在亚马逊工作对我的职业生涯影响很大,部分原因可能是我在那里度过了早期研究生涯。那里的人都对自己的工作充满热情。所以那绝对是个好环境。我只在谷歌大脑实习过。至于微软研究院对我有什么影响,我觉得是让我有机会与很多理论能力更强的人共事。这对我来说是一种全新的体验,让我看到了这种截然不同的研究方式,所以我很享受这种体验。

Q:你的研究是否与如今热门的大语言模型相关?

Alex Lamb我最早做的一些工作是关于语言建模的。我们有一篇论文叫做《Professor forcing: A new algorithm for training recurrent networks》。这篇论文试图让样本在隐藏空间中的分布具有对抗性,使网络在训练和采样期间的动态更为相似。

下一个Token预测目标在大语言建模中的效果让人有点惊讶。至少在我开始研究它的时候,也就是2015 年前后,大多数人会认为,你必须对不确定性和某种抽象或高层次的潜在空间进行建模,而现在可以直接在观察到的Token空间中建立模型。


02

为什么不远万里来到中国

Q:我们感到好奇,是什么让你决定来到中国的?

Alex Lamb在中国工作是我感兴趣的事情,因为我博士期间和北京大学的贺笛教授合作过。在我完成博士学业之后,我还打算去北京的一家跨国公司实习。我也申请过世界各地的学术工作,那时我和清华的 Andrew Chi-Chih Yao(姚期智)教授聊了聊。然后,我还去了香港等地的大学面试,也去过其他国家面试。去中国当教授,除了我个人的兴趣之外,也是因为我觉得中国的学术界正在变得更强。

在我看来,中国的工程技术优势很明显,也同样适合做一些研究类的工作。很多非常好的工程技术都来自中国,比如电动汽车、太阳能,可能还有其他东西。老实说,很多在西方国家和大型实验室工作的研究人员实际上都来自中国。因此,我认为中国的学术质量会越来越高,这是必然的。他们似乎投入了大量的资源,让中国的学术界变得更好。

Alex Lamb教授在清华的办公室

Q:在和 Andrew Chi-Chih Yao(姚期智)面试这份工作的时候,什么让你下定决心?

Alex Lamb他非常友好。以及,我接触过许多在清华当过教授的外国研究者,和一些在那里当过教授的中国研究者交谈过,他们反馈的都是好评。

Q:你和北京大学的贺笛合作了什么研究?

Alex Lamb我们研究了递归网络和Transformer的模块分解。其中一篇论文《Transformers with competitive ensembles of independent mechanisms是关于递归独立机制(Recurrent Independent Mechanisms)的。关于他正在做的其他一些工作,我也和贺笛聊过。

Q:如何看待人工智能在中国的总体发展,尤其是今年突然出现的DeepSeek  Manus 等大模型产品?你如何看待这些惊人的进步?

Alex Lamb我是在去年10月做的决定,实际上发生在这些巨变的前几个月。所以这些倒是没有影响到我的决定。但我想,用「意料之外」这个词来形容也许很贴切。

在我看来,DeepSeek是工程上的奇迹,中国的研究人员真的很棒。除了DeepSeekQwen系列模型也很不错。我要说的是,基于长期的投入,一些顶尖的研究和工程诞生了,这样的时刻是特别震撼人心的。

Q:你未来在研究或教授学生方面的目标是什么?

Alex Lamb在研究方面,我对在抽象空间中学习模型的问题非常感兴趣。生成模型已经让我们走得很远了,但我认为,如果我们能发现一种对空间的智能抽象,我们就能在那里学习模型,模型性能就会大幅提升。

此外关于前沿探索。我在想,探索和自改进的正确原则是什么?人们实际上正在做很多大型语言模型,而理论上对此的理解还远远落后。所以只是关注状态覆盖率(state coverage)之类的东西。

我认为这是一个必然的趋势。如果能解决这个问题,就能在这方面取得更多进展,会是非常有意义的。


03

AI研究者的建议

Q:对于有志于追求学业成功的年轻学生或同行,你有什么建议?

Alex Lamb我的建议是,在研究一个问题时,你必须「深思熟虑」。我能想到两种研究风格,一种人会找到一个众所周知的问题,然后就在软件上下功夫。但我认为,做研究的另一种不错方式是,尝试提出新的问题,或尝试用不同的方式看待问题。这样也许会更灵活一些。

Q:像智源研究院这样的研究机构,可以提供哪些支持和资源来帮助青年人才成长和茁壮成长?

Alex Lamb我想这可能取决于支持和资源的具体情况。你在一个地方提供,但也许有一件事是有帮助的,那就是创造一种环境,让研究人员可以自由地尝试想法、冒险,或选择结束痛苦。他们可能不会被迫去解决某个特定的问题,也不会被迫为某个产品做出贡献,因为这会迫使研究人员不得不在更短的时间内进行更多的研究。

另一件事是,还要有在工作和提出新想法方面的自由。无论是本科生、刚毕业的学生还是教授,在研究方面都需要有一种「驰骋疆场」的态度,自己的想法会被一视同仁地看待。比如,我不会严格决定谁的想法会被接受,这方面是非常开放的。

- 往期推荐 -

95后博导张林峰专访:6年前提出自蒸馏算法,高效AI助推大模型时代丨独家

本文版权归智源社区所有

内容中包含的图片若涉及版权问题,请及时与我们联系删除