DRUGAI

斯坦福大学屈元昊、普林斯顿大学黄凯旋等研究人员领衔的团队,近日联合加州大学伯克利分校、Google DeepMind等顶尖机构,成功开发出首个基因编辑AI智能体CRISPR-GPT。



该系统采用创新的状态机(state machine)架构,能够可靠地定制、理解并执行用户的复杂基因编辑需求,自主完成从CRISPR系统选择、递送系统选择、实验规划、sgRNA设计到数据分析的完整基因编辑实验流程,实现了基因编辑研究的端到端自动化,标志着AI驱动的基因编辑研究进入全新阶段。相关研究成果已发表在《Nature Biomedical Engineering》期刊,斯坦福大学教授丛乐和普林斯顿大学教授王梦迪为共同通讯作者。


图丨相关论文(来源:Nature Biomedical Engineering)


基因编辑实验设计面临重大挑战

自2012年CRISPR-Cas9系统问世以来,基因编辑技术已成为生物医学研究的核心工具。然而,要设计有效的基因编辑实验,研究人员需要对CRISPR技术和生物系统都有深入了解,这带来了巨大挑战。


传统实验设计需要大量专业训练,涉及复杂的技术选择、实验设计和数据分析等多个环节。虽然大语言模型在多个领域表现出色,但在生物医学专业领域常常缺乏足够知识,难以提供准确的生物设计方案。通用LLM如ChatGPT等存在幻觉问题,无法为研究人员提供精准、实用的基因编辑设计指导。


CRISPR-GPT:基因编辑领域专业AI智能体

图丨CRISPR-GPT智能体概述(来源:Nature Biomedical Engineering)


为解决上述挑战,研究团队开发了CRISPR-GPT——首个专门针对基因编辑领域的AI智能体系统。与通用大语言模型不同,CRISPR-GPT整合了深度的基因编辑专业知识、先进的检索技术、多样化的外部工具以及专门微调的模型,能够为研究人员提供从实验设计到数据分析的全流程自动化支持。


该系统的核心创新在于将复杂的基因编辑实验流程标准化和模块化,通过智能化的任务分解和协调,让原本需要丰富专业经验才能完成的实验设计变得简单易行。无论是基因敲除、表观遗传编辑,还是先导编辑、碱基编辑等各类基因编辑技术,CRISPR-GPT都能提供精准的实验方案。


为满足不同水平研究人员的需求,CRISPR-GPT设计了三种交互模式:

  • 预设模式:专为初学者设计,提供从CRISPR系统选择到数据分析的完整流程指导,适合基因编辑经验较少的研究人员完成完整的实验设计。

  • 自动模式:面向有经验的研究人员,用户可提交自由形式的需求,系统会自动分解任务、管理依赖关系并构建定制化工作流程,适合具备基因编辑基础的科研人员解决特定问题。

  • 问答模式:支持用户随时咨询基因编辑相关问题,提供实时专业解答,研究人员可自由咨询CRISPR基因编辑实验的各种技术问题。

这三种模式的设计充分体现了CRISPR-GPT的灵活性和实用性,能够适应不同水平用户的具体需求。该系统的最大优势在于利用LLM的推理能力处理自然语言,用户无需按固定格式输入需求,而是可以像咨询专家一样提问,解决基因编辑实验设计中的各种问题。


创新多智能体协作架构

图丨CRISPR-GPT的组成部分使人类-人工智能协作,能够在复杂任务中自动化基因编辑实验设计(来源:Nature Biomedical Engineering)


CRISPR-GPT的技术核心是一个专门用于基因编辑实验自动化设计和数据分析的LLM智能体系统。该系统融合了专业领域知识、检索技术、外部工具和定制化LLM模型。

CRISPR-GPT采用多智能体协作架构,包含四个核心组件:

  • LLM planner智能体:根据用户需求配置任务,自动分解任务并管理依赖关系

  • Task executor智能体:执行状态机链条,提供指令反馈并调用外部工具

  • LLM user proxy智能体:代表用户与任务执行器交互,监控过程并进行修正

  • Tool provider智能体:支持多样化外部工具,通过API连接搜索引擎和数据库

基于多智能体架构,CRISPR-GPT将复杂的基因编辑实验设计分解为22个标准化任务模块,涵盖完整的实验流程。这些模块包括CRISPR系统选择、递送方法推荐、引导RNA设计、脱靶效应预测、实验protocol生成、数据分析等关键环节。系统可处理基因敲除、表观遗传编辑、先导编辑、碱基编辑等多种实验类型,通过智能任务分解和依赖关系管理,根据用户需求自动选择和组合相应模块,构建个性化的实验设计工作流程。


在这些任务模块中,专业问答能力尤为关键。为此,研究团队开发了CRISPR-Llama3——一个专门针对基因编辑领域优化的大语言模型。该模型基于80亿参数的Llama3-instruct微调,使用团队精心构建的专业数据集,包含11年来CRISPR基因编辑公开论坛讨论数据,涵盖3000多个高质量问答对,内容涉及CRISPR系统选择、实验troubleshooting、protocol优化等核心问题。与通用大语言模型相比,CRISPR-Llama3在基因编辑问题回答上表现出显著优势,不仅提供更准确的技术指导,还能结合具体实验场景给出实用建议,有效避免了通用模型的幻觉问题。


权威专家评估验证卓越性能

图丨CRISPR-GPT和ChatGPT-3.5/4o在不同模式下基因编辑实验设计任务中的性能比较(来源:Nature Biomedical Engineering)


为评估CRISPR-GPT的实际效果,研究团队邀请了8名CRISPR和基因编辑专家设计测试任务,评估系统协助实验设计的能力。


专家从准确性、推理能力、完整性和简洁性四个维度,将CRISPR-GPT与ChatGPT-3.5和ChatGPT-4o进行对比。评估结果显示,CRISPR-GPT在基因编辑实验设计的所有方面以及综合评分均优于通用LLM。


此外,团队还在Gene-editing bench基准上进行了全面测试,该基准包含288个条目,涵盖四个主题:

  • 实验规划:CRISPR-GPT在准确性、精确度、召回率和F1分数上均超过0.99

  • 递送方法选择:在所有生物系统类别中均优于基线模型

  • 引导RNA设计:在功能选择和参数准确性方面显著超越基线LLMs

  • Q&A模式:在准确性、推理和简洁性方面分别比GPT-4o提升12%、15%和32%

除了基准测试,研究团队还通过真实实验验证了CRISPR-GPT的实用性。


在针对人类肺癌细胞系的实验中,CRISPR-GPT成功设计了TGFβR1、SNAI1、BAX和BCL2L1四个关键基因的敲除实验,通过CRISPR-Cas12a系统实现高效基因编辑。实验结果显示,这些基因的编辑效率达到80%。


在另一项人类黑色素瘤细胞系实验中,CRISPR-GPT成功设计并实施了NCR3LG1和CEACAM1两个基因的表观遗传激活实验,两个基因的表达水平都得到明显提升。值得注意的是,上述两项实验均实现了一次成功。

这些应用案例证明了CRISPR-GPT在实际科研工作中的可靠性和实用价值。


全方位安全防护确保负责任应用

考虑到基因编辑技术的敏感性,CRISPR-GPT内置了多层安全防护机制:

  • 涉及人体组织或器官编辑时显示警告信息

  • 提供国际准则链接和详细说明

  • 检测并阻止涉及人类种系细胞或危险病原病毒的请求

  • 实施过滤器检测敏感序列,防止敏感信息泄露

研发团队与伦理专家和基因编辑安全专家深入交流,制定了一系列预防措施,包括关键词过滤、指导原则等,对人类受试者应用进行限制,保护遗传信息隐私,并对可能的意外结果进行预警。


引领基因编辑研究智能化变革

CRISPR-GPT的推出为基因编辑研究带来重要突破,标志着该领域向智能化、自动化方向迈出关键步伐。通过自动化原本需要专家知识和编程技能的复杂流程,该系统能够显著缩短实验设计周期、提高引导RNA设计准确性、优化细胞递送方法选择并加速基因功能验证过程,让研究人员能够将更多精力投入到创新假设构建和实验优化中。


展望未来,CRISPR-GPT有望与自动化实验室平台和机器人技术集成,实现从实验设计到执行的端到端自动化,进一步推动基因编辑研究的标准化和普及化。


目前,该课题组还有一系列基于生物医学智能体研发的相关工作正在进行中:为CRISPR-GPT提供底层支撑的RNA基座大模型RNAGenesis,展现对gRNA、aptamer、ASO/RNAi等药物分子的强大设计能力。课题组参与和推出了通用科研智能体,如Biomni、STELLA系统,展示了多智能体协作与自进化能力。感兴趣的读者可以访问genomics.stanford.edu了解最新进展,并参与CRISPR-GPT智能体的beta测试。课题组持续招募PhD/博士后,欢迎联系clab.stanford.edu。

参考资料

Yuanhao Qu*, Kaixuan Huang*, Ming Yin, Kanghong Zhan, Dyllan Liu, Di Yin*, Henry C. Cousins, William A. Johnson, Xiaotong Wang, Mihir Shah, Russ B. Altman, Denny Zhou, Mengdi Wang† & Le Cong†. "CRISPR-GPT for agentic automation of gene-editing experiments." Nature Biomedical Engineering, 2025.

内容中包含的图片若涉及版权问题,请及时与我们联系删除