今日,Deepmind公布了Alphafold的最新研究里程碑成果,通过与EMBL-EBI合作,Deepmind现在正在发布几乎所有科学上已知编目蛋白质的预测结构,这将使AlphaFold数据库扩大200倍以上,从近100万个结构到超过2亿个结构,这有可能极大地提高人类对生物学的理解。

本文作者:Demis Hassabis(Deepmind CEO)

————————-————————————————————————————

背景

关于在解决蛋白质折叠方面的所有工作,请到deepmind.com/AlphaFold,或者相关时间轴

自从我们发布和开源AlphaFold并创建AlphaFold蛋白质结构数据库(AlphaFold DB),与世界自由分享这些科学知识以来,已经过去了一年。我们希望这一开创性的资源能够帮助在全球范围内加速科学研究和发现,并希望其他团队能够学习和借鉴我们在AlphaFold方面取得的进展,以创造更多的突破。这一希望成为现实的速度远远超过了我们敢于梦想的速度。仅仅12个月后,AlphaFold已经被超过50万名研究人员使用,并被用来加速解决现实世界中从塑料污染到抗生素抗性等重要问题。

上图展示了蛋白结构的范围,这次数据库更新包括植物、细菌、动物和其他生物的预测结构,为研究人员使用AlphaFold来推进他们在重要问题上的工作开辟了许多新的机会,包括可持续性、粮食不安全和被忽视的疾病等。

上图展示了AlphafoldDB的物种数量的对比,这次更新也意味着UniProt上的大多数页面都会有一个预测结构了。所有的2亿个结构也可以通过谷歌云公共数据集进行批量下载,使世界各地的科学家更容易从AlphaFold收益。

————————-————————————————————————————

"AlphaFold是生命科学领域唯一的重大进展,展示了人工智能的力量。确定一个蛋白质的三维结构过去需要几个月或几年的时间,现在只需要几秒钟。AlphaFold已经加速并促成了大规模的发现,包括破解核孔复合体的结构。而伴随几乎照亮了整个蛋白质世界的新增加的结构,我们可以期待天天都有更多的生物之谜被解开。

--Eric Topol,Scripps Research Translational Institute的创始人和主任

————————-————————————————————————————

AlphaFold迄今为止的影响

从AlphaFold最初发布到现在已经过去了12个月,回顾AlphaFold已经产生的令人难以置信的影响,以及达到今天这个里程碑的漫长历程,真是令人惊讶。

对于我们的团队来说,AlphaFold的成功特别有意义,一方面是因为它是我们所建立的最复杂的人工智能系统,需要多个关键的创新,另一方面是因为它产生了最有意义的下游影响。通过证明人工智能可以在数分钟内准确预测蛋白质的形状,AlphaFold不仅为一个长达50年的巨大挑战提供了解决方案,还成为我们创始论的第一个重要证明点:人工智能可以极大地加速科学发现,并反过来推动人类。

我们开源了AlphaFold的代码,并在《Nature》杂志上发表了两篇深度论文,这些论文已经被引用了4000多次。我们与世界领先的EMBL-EBI密切合作,设计了一个最能帮助生物学家访问和使用AlphaFold的工具,并共同发布了AlphaFold DB,这是一个可搜索的数据库,对所有人开放并免费。在发布AlphaFold之前,根据我们负责任地开拓的谨慎做法,我们向生物研究、安保、伦理和安全方面的30多位专家征求意见,以帮助我们了解如何与世界分享AlphaFold的好处,并使潜在利益最大化,潜在风险最小化。

到目前为止,来自190个国家的50多万名研究人员已经访问了AlphaFold数据库,查看了超过200万个结构。我们免费提供的结构也被整合到其他公共数据集中,如Ensembl、UniProt和OpenTargets,数百万用户将其作为日常工作流程的一部分。

上图展示了各个发表文献中的Alphafold2预测结构。

我们对AlphaFold已经成为世界各地的实验室和大学中成千上万的科学家帮助他们完成重要工作的重要工具的速度感到惊奇。至于与AlphaFold的合作,我们优先考虑那些我们认为会有最积极的社会效益的应用,尤其是那些在资金不足或被忽视的倡议。例如,我们与 "被忽视疾病药物倡议"(DNDI)合作,帮助推进他们的研究,使他们更接近于为利什曼病和南美锥虫病等严重影响世界贫困地区人民的疾病找到拯救生命的治疗方法。我们还支持热带病日,为世界卫生组织确定为高度优先研究的生物进行结构预测,帮助进一步研究麻风病和血吸虫病等疾病,而这些疾病破坏了全球10多亿人的生活。

看到研究界利用AlphaFold的无数方式,从了解疾病到保护蜜蜂,到破译生物难题,再到深入研究生命本身的起源,这一切都令人振奋。

其他留下深刻印象的例子

1. 生物拼图,来自Kathryn Tunyasuvunakool推荐

链接:https://unfolded.deepmind.com/stories/unlocking-the-nuclear-pore-complex

在最近的一期《Science》特刊中,几个小组描述了AlphaFold是如何帮助他们拼凑核孔复合体的,这是生物学中最棘手的难题之一。这个巨大的结构由数百个蛋白质部分组成,控制着进出细胞核的一切。通过使用现有的实验方法来揭示其轮廓,并使用AlphaFold预测来完成和解释任何不清楚的地方,其微妙的结构终于被揭示出来。这种强大的组合现在正成为实验室的常规,解开了新的科学,并显示了实验和计算技术如何能够一起工作。

2. 生物信息学的新世界,来自Richard Evans推荐

链接:https://unfolded.deepmind.com/stories/accelerating-the-fight-against-plastic-pollution

像Foldseek和Dali这样的结构搜索工具允许用户非常快速地搜索与给定蛋白质相似的条目。这可能是挖掘大型序列数据集以获得实际有用的蛋白质的第一步,例如那些分解塑料的蛋白质,它可以提供关于蛋白质功能的线索。这次包括超过2亿个预测结构的数据库的更新,将进一步放大这种影响。

3. 对人类健康的直接影响,来自John Jumper推荐

AlphaFold已经对人类健康产生了重大而直接的影响。与欧洲人类遗传学会的研究人员会面时,发现AlphaFold结构对生物学家和临床医生试图解开罕见遗传病的原因是多么重要。此外,AlphaFold正在加速药物发现,它使人们更好地了解新发现的可能成为药物靶点的蛋白质,并帮助科学家更快地找到与之结合的潜在药物。

————————-————————————————————————————

"AlphaFold几乎在一夜之间成为生物制药研究的重要工具,包括在ROME Therapeutics这里,它使我们能够预测黑暗基因组中以前从未被解出过的蛋白质结构。AlphaFold的速度和准确性正在加速药物发现过程,而我们只是刚刚开始意识到它对加速新药研发的影响。"

--ROME Therapeutics公司总裁兼首席执行官、Nimbus Therapeutics公司前CSO Rosana Kapeller

————————-————————————————————————————

未来展望---这只是开始

AlphaFold已经将生物学带入了一个结构丰富的时代,以数字的速度开启了科学探索。AlphaFold数据库作为蛋白质结构的 "谷歌搜索",为研究人员提供了即时访问他们正在研究的蛋白质的预测模型,使他们能够集中精力加快实验工作。从抗击疾病到开发疫苗,AlphaFold已经使我们在一些最大的全球挑战上取得了令人难以置信的进展,而这只是我们在未来几年将开始看到的影响的开始。我们希望这个扩大的数据库能够帮助更多的科学家开展工作,并为科学探索开辟全新的途径,例如元蛋白组学。

在DeepMind,我们正在努力建设所有这些潜力,在许多领域进行重大投资,包括与我们新的姐妹Alphabet公司Isomorphic Labs合作,以人工智能为先的方法从第一性原理重新想象整个药物发现过程。我们在著名的Francis Crick研究所建立一个湿实验室,以加强人工智能与实验技术之间的联系,促进对生物学的理解,包括蛋白质设计和基因组学。同时我们也在扩大人工智能科学团队,以加快我们的基础生物学研究的进一步进展,并将人工智能应用于其他迷人的重要科学挑战,如气候科学、量子化学和核聚变。

AlphaFold是对未来的一瞥,可以看到将计算和人工智能方法应用于生物学可能带来的结果。在其最基本的层面上,生物学可以被认为是一个信息处理系统,尽管是一个异常复杂和突发的系统。正如数学是物理学的完美描述语言一样,我们相信人工智能可能会成为应对生物学动态复杂性的正确技术。AlphaFold是这方面的第一个重要的证明点,也是未来更多的标志。作为 "数字生物学 "这一新兴领域的先驱,我们很高兴看到人工智能的巨大潜力开始被实现,成为人类推进科学发现和理解生命基本机制的最有用的工具之一。