DRUGAI
6月25日,Google DeepMind 团队在预印本平台发布了其最新人工智能模型 AlphaGenome,该模型有望成为解读人类基因组“暗物质”的关键工具。它不仅能识别 DNA 序列中的基因区域,还能预测基因表达水平如何受到单个碱基突变的影响,成为科研人员追踪疾病成因和合成生物学设计的有力助手。

一次性解决多个基因功能预测任务
AlphaGenome 是首个能够处理整个人类基因组并预测 DNA → RNA → 蛋白质表达级联效应的 AI 模型。它可接受最长达 100万个碱基对的 DNA 序列输入,并预测其中基因起止位置、RNA 剪接形式、表达水平,以及各种转录调控因子的结合位点。
不同于过去只能解析约2%编码区的 AI 工具,AlphaGenome 能够解析整段基因组,包括非编码调控区域,在预测基因变异对表达影响方面,超过了目前已知大多数模型。它在多个基因组功能预测基准测试中表现优异,击败了 22/24 个已有模型。
应用于疾病研究与合成生物学
在癌症、免疫疾病等研究中,研究人员通常会识别出成千上万个 DNA 单点变异,但难以判断哪些变异具有生物学意义。AlphaGenome 提供了变异影响力排名功能,帮助研究人员聚焦于最可能影响基因表达的突变,极大提高后续实验效率。
此外,AlphaGenome 也对合成生物学具有潜在意义,能够辅助设计人工 DNA 序列,预测其调控能力、表达效率等功能,大幅减少实验成本。
局限性与未来展望
尽管成果显著,AlphaGenome 仍存在一定限制:
当前训练数据仅来自人类和小鼠,泛化到其他物种尚未验证;
对距离基因超过10万碱基的远程调控效应预测能力仍不足;
缺乏对动态细胞状态(如染色质状态、表观修饰等)的建模能力。
DeepMind 计划在论文正式发表后开源模型代码与权重,同时也将持续扩展其功能,包括更好地建模复杂性状和多因素疾病机制。
DeepMind 科学负责人 Pushmeet Kohli 表示:“这款模型就像是 AlphaFold 的第一代,是我们迈出的重要一步。”
整理 | WJM
参考资料
https://doi.org/10.1038/d41586-025-01998-w
https://www.science.org/content/article/deepmind-s-latest-ai-tool-makes-sense-changes-human-genome
https://deepmind.google.com/science/alphagenome/
内容中包含的图片若涉及版权问题,请及时与我们联系删除
评论
沙发等你来抢