![](https://simg.baai.ac.cn/hub-detail/1ed08eaa49535fffe4c98b28bd2edf8c1715794222210.webp)
5月8日,谷歌DeepMind等团队开发的AlphaFold3登上Nature,人工智能再一次引爆了生命科学。与前代相比,AlphaFold3在精确度上做出较大提升的同时,广度更是做到了前所未有:将预测范围从蛋白质拓展至DNA、RNA、配体、离子等更多生物分子,为人类理解生物世界提供了强大的统一框架。不仅如此,人们还发现,刚刚问世的AlphaFold3,以胜利者的姿态席卷了几乎所有领域,包括AutoDock、RoseTTAFold等多个知名模型成为其手下败将,就连业内大佬David Baker都甘拜下风,直言这比他的团队开发的同类算法更好。不过在RNA领域,AlphaFold3却碰到了钉子,智峪生科的AIchemy_RNA2仍保持着较大优势,DeepMind研究人员称其为“人工干预下表现最好的参赛者”。![](https://simg.baai.ac.cn/hub-detail/e22ae6398ef10fb0298fef8793e9ca521715794222210.webp)
图:AlphaFold3在RNA结构预测的表现不及AIchemy_RNA2在CASP15上的成绩资料显示,在第15届蛋白质结构预测比赛(CASP 15)上,成立于2021年4月的智峪生科表现惊艳,在RNA结构预测、蛋白质-小分子配体复合物结构预测两个赛道中分别取得冠军和前三的亮眼成绩。公司CEO为王晟博士,博士后师从“AI预测蛋白质结构全球第一人”许锦波教授,曾为腾讯 AI Lab 的高级研究专家,主导开发了tFold 工具,该方法曾在全球蛋白质结构预测自动评估平台CAMEO中连续半年保持周度冠军。强大的初创团队和研究成果,让智峪生科颇受资本青睐,公司先后完成三轮融资,投资者包括高瓴创投、鼎晖投资、清池创投、惠每资本等知名机构。去年5月,完成了超亿元A 轮融资的公司表示,将进一步深耕“AI+合成生物学”,包括打造新一代AI生成型合成生物学智造平台并推进产品快速落地。近年来,AI不断带给生命科学惊喜,而智峪生科等公司的存在,证明了中国在该领域拥有世界一流的团队,为本土产业和投资机构提供不可错过的机遇。
第一是如何炼成的
作为全球范围内的生物分子结构预测盛会,每两年举办一次的CASP大赛吸引着来自各个国家的顶尖科研队伍。在2022年年底举办的第15届CASP上,新增了蛋白质-小分子复合体预测和RNA结构预测两个领域,显示出学界对于拓展更多分子领域的热情。其中,由智峪生科团队开发的Alchemy RNA2,击败了一众参赛者,成为RNA结构预测赛道的冠军。这是智峪生科第一次参加CASP,而其首战的惊艳表现,引得业内侧目。作为蛋白质结构预测领域的资深学者,智峪生科CEO王晟博士自然不会对CASP陌生,自2008年以来,他已参加8届,并多次获得第一名的好成绩。资料显示,王晟拥有超十年蛋白质结构预测研究经验,博士毕业于中科院理论物理所,博士后研究师从芝加哥丰田计算技术研究所教授许锦波,曾作为主要开发者开发出 RaptorX-Contact方法,首度证明了深度学习方法预测蛋白质结构的可行性。在RNA领域,公司提出了两种结构预测工具,一种是基于AI的预测方法AIchemy_RNA,另一种是统计能量函数AIchemy_RNA2。![](https://simg.baai.ac.cn/hub-detail/e4f49b4addd539f2801bed7a73337c4b1715794222211.webp)
图:CASP15上RNA 结构预测成绩居于前列的模型们其中AIchemy_RNA2由彼时公司CTO熊鹏博士领导开发,其核心是他在周耀旗课题组工作时所主导开发的RNA-BRiQ统计能量函数,对于人工合成的RNA,或从未出现在PDB数据库中的天然RNA结构的建模,有着非常优异的效果。
面对高徒做出的成就,国际知名结构生物信息学专家周耀旗赞扬到:“智峪生科公司熊鹏带领的团队,作为RNA三维结构预测的新手,一举超越多个在这个领域耕耘多年的专家,成为第一人,这是一件很了不起、非常不容易的事情。”而AIchemy_RNA同样取得了好成绩,其在所有的AI预测方法中名列第一,被DeepMind研究人员称为“表现最好的机器学习系统”。据了解,AIchemy_RNA底层算法称之为 RhoFold,由智峪生科联合港中文李煜教授和复旦大学孙思琪教授团队共同研发,是全球第一款端到端RNA三维结构预测的深度学习模型。通过其独特设计,AIchemy_RNA在有限的 RNA 结构数据上训练出了一个较为高效准确的模型,对于同源序列的天然RNA,可以比较精准预测其三维结构,整个过程不过几分钟,较物理方法更快。而对于不适合采用多重序列比对(MSA)的RNA,如人工合成的RNA或从未出现在 PDB 数据库中的天然 RNA 结构,AIchemy_RNA会给出预测置信度,并给出需要进一步处理的提示。值得注意的是,虽然学界已经在RNA结构预测领域取得突破,但相对于蛋白质的结构预测精度还有很大的一段距离,距离应用则更加遥远。最大障碍则是数据问题,目前人们对RNA的高级结构信息了解甚少:在蛋白质数据库(PDB)中,截止到2022年7月,纯RNA和RNA-蛋白质复合物的结构数据分别仅有1644和4371条,分别仅占总数的0.9%和2.2%。
投身合成生物学
借助AI在大分子(包括蛋白质、核酸以及其复合物)的突破,智峪生科瞄准了合成生物学这个新兴赛道。据波士顿咨询数据,全球合成生物学产业市场规模从2018年的53亿美元增长至2023年的超过170亿美元,预计全球合成生物市场在可见的未来仍将保持较快发展势头,到2028年将达到近500亿美元。具体来看,合成生物学产业上游侧重底层技术颠覆,主要围绕设计—构建—测试—学习(DBTL)展开,而在这四个关键环节上,智峪生科均提供了相应的AI赋能方案。以峪云ZCloud平台为例,这是公司自主打造的一个综合型生物计算软件平台,涵盖了大分子设计、分子模拟、自由能计算、序列与结构检索等诸多领域,在核心催化元件(例如酶)的设计与改造上取得了重大突破。不仅如此,智峪生科还进一步拓展合成生物的下游,加速工业化落地进程。据悉,成立不久后,公司便吸收了一支在合成生物学产业界领域有相当丰富经验的合成生物学团队,这支团队在代谢发酵工程方面具有丰富的经验,曾经生产出千克级、吨级的各类合成生物学产品。公司希望打通上游的计算和设计端到下游的中试阶段,将蛋白设计的能力体现到具体的产品中,再根据产品未来的商业前景及规模化生产的难度,来选择是自行生产销售或是通过技术转让的形式授权给合作单位。去年,智峪生科与聚焦天然食品添加剂等配方类产品的江苏一鸣生物股份有限公司达成合作,根据备忘录,公司将针对一鸣生物重点关注的工业酶和及其生产体系进行设计和优化,帮助其提升工业化效率、降低生成成本。
中国团队崛起
在人工智能的加持下,国内团队在部分领域对西方实现了追赶超越。在蛋白质预测竞技场上,此前常年占据榜单的主要是来自欧美顶级生物实验室。近年,随着一些国内人工智能公司的加入,逐渐改变了局面。在CASP 15上,包括华深智药、深势科技、上海天壤、分子之心、智峪生科等在内的多家中国公司崭露头角,RNA结构预测类别中,智峪生科熊鹏团队居榜首;蛋白质-配体复合物预测类别中,普美瑞生物常珊博士团队位列第一。![](https://simg.baai.ac.cn/hub-detail/f44e125ecc4a7577b2a58c0b11b2502a1715794222211.webp)
图:普美瑞CoDoc获蛋白/RNA-配体复合物结构预测第一名此外,清华、北大、人大、山大、浙工大、江苏理工、上海科大、西湖大学、中科院计算所的高校团队也取得不俗表现,在单体蛋白预测中,山东大学杨建益团队排名第一;蛋白质复合物界面接触残基精度评估类别中浙江工业大学张贵军团队居于榜首。部分专业人士表示,中外在AI+合成生物学领域基本处于同一起跑线,而庞大成熟的产业链体系,又为国内团队在技术落地应用方面提供了优势。与此同时,作为“新质生产力”的重要新赛道,生物制造近来成为市场焦点,据央媒报道,有关部门正在研究制定国家层面的生物制造顶层规划文件。未来,在学界、市场和政府三方合力之下,中国合成生物学无疑将迎来巨大发展,而AI作为其中的重要引擎,也将极大推动国内相关产业的快速发展。在全球范围内,一个巨大的技术革命正在拉开帷幕,而中国,正在其中扮演越来越重要的角色。—The End—
推荐阅读
![](https://simg.baai.ac.cn/hub-detail/c2d10a16013e589d60b1845dec05cb951715794222212.webp)
![](https://simg.baai.ac.cn/hub-detail/0d55d721b0d216f2a2967e073642b0081715794222212.webp)
![](https://simg.baai.ac.cn/hub-detail/084e92e8f8e5480383dc0812e2ac2beb1715794222212.webp)
![](https://simg.baai.ac.cn/hub-detail/1de338fbafc0ae86f43c3c26011ede211715794222212.webp)
内容中包含的图片若涉及版权问题,请及时与我们联系删除
评论
沙发等你来抢