AlphaFold3这是要开源了?


今日,Google DeepMind的研发人员宣布,将在6个月内发布AlphaFold3(包括权重)模型,以供学术界使用!


同时,网页版本的AlphaFold server使用限制也将从每人每天的10次提升到20次。



要知道早在5天前发布之时,DeepMind方面还表示短期内没有开源计划。


为什么反转这么快?多半是被骂出来的......


不开源惹众怒


5月8日, Google DeepMind  发布了新一代AlphaFold3。


这是一种革命性模型,用于预测蛋白质、DNA、RNA、小分子等的几乎所有生物分子结构和相互作用。


当时所有溢美之词都涌向了它:“AlphaFold3 拥有前所未有的能力,能够以惊人的精度预测生命分子之间复杂的相互作用。”


对于药物研发而言,预测分子如何相互作用是一件非常重要的事情,因为大多数药物的作用原理是与目标蛋白质结合。这一模型有望极大地促进药物研发。


图:AlphaFold3对普通感冒病毒Spike蛋白与单糖的相互作用时候的结构预测


尽管科学界非常高兴AlphaFold3的出现,但是这次DeepMind并不像上次那么宽厚,而是对该模型的应用有了各种考量。


Google DeepMind的首席执行官Hassabis 曾明确表示,对于AlphaFold3没有发布完整代码的计划。


取而代之的是网页版的AlphaFold server。


尽管相较于AlphaFold2的colab版本,这次的网页版使用更加丝滑,可视化也提升不少,但仍然遭到了来自学术界的大量批评。


甚至每个用户每天只能生成10次,对于学术研究这种需要大量试错的任务而言,限制特别大。


并且可预测的配体也仅包含常见的十几种,包括ATP、AMP、GTP、FADNAD、HEM,但它实际能预测的多达几百种,与药物相关的配图无法预测,阉割非常严重。


这也是AlphaFold3受到很多科学家们诟病的地方,毕竟AlphaFold2是完全开源,这一举动极大地促进了计算蛋白质的进步。


不少科学家直接开大招嘲讽:哪里有AlphaFold3?


只有 alphafoldserver.com ,它严格限制了科学和生物医学研究!



甚至有人效仿当时的RosettaFold,准备开启AlphaFold3的开源计划,并称:“AlphaFold 有能力拯救数十亿人的生命,但由于贪婪和腐败,它已对所有人关闭。”


更加引起众怒的是,AlphaFold3没法被科学家随意使用,但是DeepMind 的药物发现子公司 Isomorphic Labs 已经在使用该模型来实现药物研发,并且和制药公司合作,尝试开发新的疾病治疗方法。


Isomorphic 正是 DeepMind 基于 AlphaFold2 的成果转化而来的公司,其中很多员工都是来自DeepMind团队。


这次AlphaFold3也是被宣传为Google DeepMind和Isomorphic Labs 联合开发。


今年1月, Isomorphic Labs 和两家全球顶级药企礼来和诺华达成合作协议总合作金额超30亿美元Isomorphic Labs分别获得了4500万美元与3750万美元的预付款。


而AlphaFold3网页版本被限制用于药物发现,也被视作“资本的手段”,因为DeepMind不希望有人和 Isomorphic Labs 竞争。


不过好在DeepMind听到了各位科学家的呼吁,今天Google DeepMind计算机科学家兼研究副总裁Pushmeet  Kohli在社交媒体上表示:


AlphaFold3网页版每天的访问数量将从10次提升到20次,并且将在6个月内发布用于学术用途的AlphaFold3模型(包括权重)。


这下科学家们终于气消了,并且表示越快越好,他们已经迫不及待地想要将AF3部署到本地,并且开始各种测试和研究了。


不过,即使DeepMind宣布将AlphaFold3开源,很多科学家仍然不满意它的做法,因为考虑到AlphaFold2的开源方式,这次可以称得上严重倒退。


因为2021年7月,伴随着AlphaFold2论文登上Nature的同时,DeepMind就自觉开源代码和权重了。


离不开的学术社区


为什么科学家们如此执着于模型开源呢?


因为AlphaFold2开源后来自学术社区的广泛研究和拓展,极大地推动了科学研究的发展,才会有“后AlphaFold时代”的说法。


蛋白质结构预测方面,AlphaFold2让各个学术和商业团体掀起了新一波“模型挑战赛“,都以打败AlphaFold2取得SOTA为荣,极大促进了该领域的发展。


而作为结构预测的逆问题——蛋白质设计领域,很多优异的模型都是以AlphaFold或者RosettaFold为起点用于高精度的蛋白质生成及发现,例如ProteinMPNN、ProGen、RF Diffusion、Chroma等


在商业市场,全球第一批AI+蛋白质企业登上历史舞台。



此外,AlphaFold还被广泛用于探索药物研发,提升预测蛋白质复合物的相互作用精度,更不要提与蛋白质结构预测不那么相关的领域,育种、环境保护等。


截止目前,AlphaFold2当初发布于Nature的学术文章被引量已经达到了22200次,可见学术界近年来从未停下对该模型的研究,也极大地拓展了它的能力边界。


可以想象,AlphaFold3的开源版本也将在学术社区带来各种多样化的探索和提升。


但有一个问题是:当涉及到商业化的问题,AlphaFold3具体会开源到哪种程度?


是发布一款学术版的AF3并开源,还是AF3面对学界开源,我们都不得而知。


当初AlphaFold2仅开源推理代码,训练的部分没有公开。上文的开源通知也仅说明是学术版本,无法商用,到时候有可能也并不是完整开源。


实际上,对于一家商业化公司,保护其核心资产也无可厚非。但是对于能够提升全人类科学进步的问题,又需要有奉献并且取舍。


就看DeepMind到时候厚不厚道了。


—The End—


推荐阅读



内容中包含的图片若涉及版权问题,请及时与我们联系删除