万众瞩目下,今年10月,有着诺贝尔奖“嫡传”之称的诺贝尔化学奖终于揭晓,授予了对“链接化学和生物正交化学的发展作出了贡献”的三位化学家,他们分别是美国化学家Carolyn R. Bertozzi、丹麦化学家Morten Meldal、美国化学家K. Barry Sharpless。

实际上,靴子落地前,关于这一奖项到底花落谁家引起了无数热议。其中国际化学领域权威期刊《Chemical Reviews》就曾对该奖获得者进行了读者投票预测,带领DeepMind团队开发出能够精准预测蛋白质结构的AlphaFold 2的John Jumper获得了最高票数。

尽管由于“时间问题”,最终John Jumper并未折桂,但在此之前,John Jumper团队已成功拿到了另一个堪称“豪华版诺贝尔奖”、“科学界的奥斯卡”的奖项——2023年生命科学突破奖(Breakthrough Prize in Life Sciences),这是迄今科研领域里奖金最高的生物学及医学奖项。

为何John Jumper及其领导开发的AlphaFold会收获如此多的青睐?主要原因在于,AlphaFold的诞生解决了困扰生物学界半个多世纪的经典难题,即1972年诺贝尔化学奖得主Christian Anfinsen提出的蛋白折叠问题(Protein Folding Problem)——“蛋白质的氨基酸序列应该能完全决定其结构”。

John Jumper团队开创性地利用人工智能技术,终于破解了这一著名猜想,不仅让蛋白质结构预测的研究走入一个新阶段,也将人们对“AI for Science(科学智能)”的关注推向高潮。

简单来说,AI for Science就是让人工智能利用自身强大的数据归纳和分析能力去学习科学规律和原理,得出模型来解决实际的科研问题,特别是辅助科学家在不同的假设条件下进行大量重复的验证和试错,从而大大加速科研探索的进程,如今这一方法已在多个前沿科学领域中取得了显著的成果。

图片

与大家此前耳熟能详且触手可及的人工智能应用相比,AI for Science所涉及的生物制药、能源、材料研发等科研领域尽管离大众生活看似遥远,但其背后的共同之处在于,利用人工智能来“解放”生产力——让人们能够从许多重复性、机械化的基础工作中释放出来,在人工智能的辅助下进行更高效的生产工作。这正是人工智能的价值和魅力所在。

 

图片

AI for Science:用人工智能催化一场新的“科学革命”

让我们回到AlphaFold,从解析蛋白质的技术演进,来观察AI的加入到底能给科研带来怎样的颠覆。

作为生命的物质基础,蛋白质与生命及各种生命活动有着极其紧密的联系,包括人体所有疾病的发生几乎都与蛋白质功能异常有关。换句话说,如果能人为地激发或抑制蛋白靶标,“控制”蛋白质的结构和功能,就能够大大加速对疑难杂症的靶向药物和高效疗法的研发。

在过去,生物学家们曾广泛使用X射线衍射、冷冻电子显微镜等实验技术来破译蛋白质的三维结构,这类方法耗时长且成本高。因此从1994年开始,多支科研团队在两年一届的国际蛋白质结构预测竞赛(CASP,Critical Assessment of protein Structure Prediction)上施展拳脚,并由此催生了I-TESSER、RaptorX、RoseTTAFold等蛋白质结构预测模型。

但是问题也随之而来,这些大部分用计算机基于理论预测的蛋白质结构模型,其实与实际观测到的实验数据相去甚远,正确率不足40%。其后续发展需要持续提高预测模型的精度,以无限缩小预测结构和实验误差。

不仅如此,从蛋白质结构预测推进到药物研发环节,不同药物设计方法的原理和应用场景也有着极大差异。例如在制药流程中,从前端的靶点发现、先导化合物的筛选优化,再到后期ADMET预测、甚至临床效果预测等多个环节,都面临着独特的技术挑战。在这个过程中,研究人员必须要进行高通量的重复性实验,甚至要花费多年的时间,验证次数也高达数百万次。

而今,回看这个半世纪以来令无数学者着迷却又难以跨越的难题,不过是科研领域延绵壁垒中的冰山一角。而成熟的AI技术与科研领域及多学科交叉融合诞生的“AI for Science”,无疑给这个难题以及人类在科学无人区的更多探索带来了全新的可能性。

从2020年开始,AI for Science进入了集中爆发的发展阶段,其中就包括了AlphaFold项目,其最新成果——由DeepMind在2021年发布的AlphaFold 2,已能成功预测98.5%的人类蛋白质三维结构,且预测结果与大部分蛋白质的真实结构只相差一个原子的宽度,可达到以往通过冷冻电子显微镜等复杂实验观察预测的水平。

类似于生命科学领域,分子动力学领域也出现了影响力同样显著的DeePMD-kit项目,其通过利用机器学习、高性能计算技术与物理建模相结合,能够将分子动力学的极限提升至10亿原子规模,同时保持高精度,大大解决了传统分子动力学中“快而不准”、“准而不快”的难题。

还有在气象预测领域,基于新型算子学习的神经网络模型FourCastNet,能够将天气预报提速45000倍;在工业领域的流体、结构等PDE方程求解方面,也已证实基于数据+物理机理融合的AI方法,是解决复杂高维物理问题的突破口……

图片

一言以蔽之,无论是今年爆火的AI绘画、AI对话模型ChatGPT等AI应用,亦或是大量AI for Science领域的项目案例,都足以证明AI正在为各个行业、领域带来了一场范式革新。但AI for Science更重要的意义在于,其对前沿科研所施加的加速作用,将对人类社会和经济发展有着更为基础,也更为深远的影响。

而且,AI for Science的应用也不仅仅局限于依据已知科学原理来高效验证或试错,它也让更多科研人员能够基于AI在更复杂的场景中做探索,结合数据反推复杂场景下更为准确的物理规律。

毫不夸张地说,人工智能将成为科学家继计算机之后的全新生产工具,同时也正在催化一场新的“科学革命”。

内容中包含的图片若涉及版权问题,请及时与我们联系删除