AlphaFold3这是要开源了?
今日,Google DeepMind的研发人员宣布,将在6个月内发布AlphaFold3(包括权重)模型,以供学术界使用!
同时,网页版本的AlphaFold server使用限制也将从每人每天的10次提升到20次。
要知道早在5天前发布之时,DeepMind方面还表示短期内没有开源计划。
为什么反转这么快?多半是被骂出来的......
不开源惹众怒
5月8日, Google DeepMind 发布了新一代AlphaFold3。
这是一种革命性模型,用于预测蛋白质、DNA、RNA、小分子等的几乎所有生物分子结构和相互作用。
当时所有溢美之词都涌向了它:“AlphaFold3 拥有前所未有的能力,能够以惊人的精度预测生命分子之间复杂的相互作用。”
对于药物研发而言,预测分子如何相互作用是一件非常重要的事情,因为大多数药物的作用原理是与目标蛋白质结合。这一模型有望极大地促进药物研发。
图:AlphaFold3对普通感冒病毒Spike蛋白与单糖的相互作用时候的结构预测
尽管科学界非常高兴AlphaFold3的出现,但是这次DeepMind并不像上次那么宽厚,而是对该模型的应用有了各种考量。
Google DeepMind的首席执行官Hassabis 曾明确表示,对于AlphaFold3没有发布完整代码的计划。
取而代之的是网页版的AlphaFold server。
尽管相较于AlphaFold2的colab版本,这次的网页版使用更加丝滑,可视化也提升不少,但仍然遭到了来自学术界的大量批评。
甚至每个用户每天只能生成10次,对于学术研究这种需要大量试错的任务而言,限制特别大。
并且可预测的配体也仅包含常见的十几种,包括ATP、AMP、GTP、FAD、NAD、HEM,但它实际能预测的多达几百种,与药物相关的配图无法预测,阉割非常严重。
这也是AlphaFold3受到很多科学家们诟病的地方,毕竟AlphaFold2是完全开源,这一举动极大地促进了计算蛋白质的进步。
不少科学家直接开大招嘲讽:哪里有AlphaFold3?
只有 alphafoldserver.com ,它严格限制了科学和生物医学研究!
甚至有人效仿当时的RosettaFold,准备开启AlphaFold3的开源计划,并称:“AlphaFold 有能力拯救数十亿人的生命,但由于贪婪和腐败,它已对所有人关闭。”
更加引起众怒的是,AlphaFold3没法被科学家随意使用,但是DeepMind 的药物发现子公司 Isomorphic Labs 已经在使用该模型来实现药物研发,并且和制药公司合作,尝试开发新的疾病治疗方法。
Isomorphic 正是 DeepMind 基于 AlphaFold2 的成果转化而来的公司,其中很多员工都是来自DeepMind团队。
这次AlphaFold3也是被宣传为Google DeepMind和Isomorphic Labs 联合开发。
今年1月, Isomorphic Labs 和两家全球顶级药企礼来和诺华达成合作协议总合作金额超30亿美元,Isomorphic Labs分别获得了4500万美元与3750万美元的预付款。
而AlphaFold3网页版本被限制用于药物发现,也被视作“资本的手段”,因为DeepMind不希望有人和 Isomorphic Labs 竞争。
不过好在DeepMind听到了各位科学家的呼吁,今天Google DeepMind计算机科学家兼研究副总裁Pushmeet Kohli在社交媒体上表示:
AlphaFold3网页版每天的访问数量将从10次提升到20次,并且将在6个月内发布用于学术用途的AlphaFold3模型(包括权重)。
这下科学家们终于气消了,并且表示越快越好,他们已经迫不及待地想要将AF3部署到本地,并且开始各种测试和研究了。
不过,即使DeepMind宣布将AlphaFold3开源,很多科学家仍然不满意它的做法,因为考虑到AlphaFold2的开源方式,这次可以称得上严重倒退。
因为2021年7月,伴随着AlphaFold2论文登上Nature的同时,DeepMind就自觉开源代码和权重了。
离不开的学术社区
为什么科学家们如此执着于模型开源呢?
因为AlphaFold2开源后来自学术社区的广泛研究和拓展,极大地推动了科学研究的发展,才会有“后AlphaFold时代”的说法。
在蛋白质结构预测方面,AlphaFold2让各个学术和商业团体掀起了新一波“模型挑战赛“,都以打败AlphaFold2取得SOTA为荣,极大促进了该领域的发展。
而作为结构预测的逆问题——蛋白质设计领域,很多优异的模型都是以AlphaFold或者RosettaFold为起点,用于高精度的蛋白质生成及发现,例如ProteinMPNN、ProGen、RF Diffusion、Chroma等。
在商业市场,全球第一批AI+蛋白质企业登上历史舞台。
此外,AlphaFold还被广泛用于探索药物研发,提升预测蛋白质复合物的相互作用精度,更不要提与蛋白质结构预测不那么相关的领域,育种、环境保护等。
截止目前,AlphaFold2当初发布于Nature的学术文章被引量已经达到了22200次,可见学术界近年来从未停下对该模型的研究,也极大地拓展了它的能力边界。
可以想象,AlphaFold3的开源版本也将在学术社区带来各种多样化的探索和提升。
但有一个问题是:当涉及到商业化的问题,AlphaFold3具体会开源到哪种程度?
是发布一款学术版的AF3并开源,还是AF3面对学界开源,我们都不得而知。
当初AlphaFold2仅开源推理代码,训练的部分没有公开。上文的开源通知也仅说明是学术版本,无法商用,到时候有可能也并不是完整开源。
实际上,对于一家商业化公司,保护其核心资产也无可厚非。但是对于能够提升全人类科学进步的问题,又需要有奉献并且取舍。
就看DeepMind到时候厚不厚道了。
—The End—
推荐阅读
内容中包含的图片若涉及版权问题,请及时与我们联系删除
评论
沙发等你来抢