AIGC 的发展高开猛走。当人们还在因为 AIGC 在绘画、写作等领域的出色表现而惊叹不已,它已经大步迈入进击生命科学的新阶段。

近日,国内 AI 公司天壤发布了基于扩散的生成模型  TRDiffusion,一种优异的蛋白质设计新方法。TRDiffusion 从零开始创造,生成全新的蛋白质结构,而非自然界中已经存在的天然蛋白质。

图片

图:天壤 TRDiffusion 生成的全新的蛋白质结构

第四代蛋白质从头设计

蛋白质是一种含有氨基酸的分子,它们是组成和维持生命的基本物质。因其空间结构决定了生物学功能,使得从头设计蛋白质三维结构来精准实现目标功能成为可能。

蛋白质从头设计最早出现在20世纪80年代左右。第一代蛋白质设计通过简单化学原理指导二级结构的组装;第二代蛋白质设计加入了专家经验,通过序列-结构关系来指导二级结构组装;第三代有了明显突破,从已知结构中提取的知识能量函数最小化来寻找目标蛋白质。

前三代设计方法都存在极大限制,比如依赖专家经验或者天然蛋白质。

直到21世纪,随着蛋白质三维结构数据的快速增长,以AI主导的蛋白质设计在2022年爆发,实现了自动探索巨大的蛋白质空间,端到端的设计蛋白质序列和结构。

同年,AIGC 爆火,其发展启发了计算生物学家,「基于扩散的蛋白质生成」成为第四代蛋白质设计的新方向。

基于扩散的蛋白质生成模型 TRDiffusion

据天壤研究团队介绍,相比其它模型,基于扩散的生成模型更接近人的思维模式,也是 AIGC 拥有开放性创造力的原因之一,其工作原理是通过连续添加高斯噪声来破坏训练数据,然后通过反转噪声过程来学习恢复数据。

图片

图:天壤 TRDiffusion 的原理图示
阅读详情

内容中包含的图片若涉及版权问题,请及时与我们联系删除