
近期,“创世纪计划”在全球引发高度关注,表明人工智能与科学研究深度融合已进入提速阶段。
2024年末,临港实验室启动元生计划,并在2025年6月联合上海人工智能实验室、上海交通大学、复旦大学等机构公开发布了元生虚拟疾病生物学家v1.0版本(超越OpenAI!临港实验室首发AI虚拟疾病生物学家“元生”,刷新多项纪录,破解药物靶标发现难题)。元生虚拟疾病生物学家通过系统性的干湿结合研究,验证了其在规模化生成原创科学假说方面的能力,并在我国人群重大疾病相关靶标的发现与验证中发挥了重要作用。
今天,元生虚拟疾病生物学家v1.3版本(https://origene.lglab.ac.cn/)正式上线,并推出升级版科学假说发现模式。基于智能体实战经验和用户反馈,v1.3版本全面升级了认知能力与知识体系,以进一步适配创新药研发场景中所呈现的超长上下文、复杂知识空间、多层证据链、多模态以及多决策节点等特性。
新模式总体文献阅读总量提升10倍、文献幻觉率相较行业标杆方法减少约40%、平行调研能力提高逾10倍。深度模式下单次任务可完成对超过1000篇文献和多模态数据的阅读与关联分析,将假说生成的广度、深度与可信度放大到工业级规模。随着规模化研究能力落地,元生正在推动重构生物医药创新体系的科研范式。
接下来,我们将详细介绍本次版本的核心架构升级与实测表现。
01
多智能体虚拟协作空间
元生v1.3模式创新性地构建了一个能够有序地组织和监督大规模智能体的虚拟协作空间。

图1 智能体虚拟协作空间
在纵向信息处理工序上,v1.3在调研开端新增了假说生成模块,面对用户对新科学假说的需求进行“合理候选生成”和“快速迭代筛选”,为深度调研步骤提供理想起始点。
在横向调研广度上,v1.3能够自动对复杂科学问题进行合理的独立研究方向划分,对每个研究维度进行独立深入探讨,直至在该角度上足够形成证据充足、逻辑完整的研究报告。各个角度基于证据的报告支撑起v1.3最终形成围绕单主题的多角度研究成果,避免了现有智能体体系易落入局部单一视角问题。
元生v1.3的设计理念是用户应该实时掌握智能体调研团队在科学研究过程中的关键决策和重要信息流动。如图1所示:元生v1.3创新构建智能体调研团队可视化界面,在多环节、多角度的调研过程中,实时展示当前主智能体数目、科学任务,以及思考和决策过程。未来版本将开放更多智能体人类协同和互动功能。
02
特性:工业级知识管理和调研能力
元生v1.3的强大调研能力由海量的科学文献和网页作为科学证据支撑,相较于v1.0文献阅读量提升10倍以上。

图2 元生v1.3版本主要升级的能力维度
文献来源和广度提升10倍
基于坚实的文献基建,元生v1.3大大提升了文献来源广度和阅读能力,针对每个细分问题在30s时间量级内给出约10篇科学文献回应。在v1.3深度研究模式中,智能体系统平均阅读超过1000篇科学文献或网页来生成满足严肃科研场景、证据充分的调研结果。
文献引用幻觉率较行业标杆减少40%
幻觉问题——尤其是文献引用幻觉——是科学研究智能体系统面对的最大挑战之一。在整体文献引用数量和文献阅读数量均超过同类产品10倍的前提下,v1.3版本的引用证据正确率仍保持>90%,显著超过Gemini,GPT,DeepSeek,和其他深度调研类及智能体类产品。文献正确率的提升源自于元生v1.3的知识框架迭代,使其能够进行“科学陈述-支持证据-原始文献”的溯源,从而使智能体在最终结果中更多使用可查询的证据。
平行调研能力提高10倍
元生v1.3通过大规模智能体协同架构,显著提升对复杂科学问题的平行调研能力。新版本将复杂问题自动拆解为5–10个独立但互补的调查维度,并为每个维度部署专用子智能体。这些子智能体可自主调度下级智能体,并行开展文献阅读、证据整合、假设推演与反思优化,实现深度与广度的同步扩展。相较于上一版本,v1.3的整体调研吞吐量提升约10倍,关键维度的分析深度平均提升一倍以上。这一架构使元生初步具备虚拟科研团队的协作能力,为生成更可靠、更系统的科学假说奠定基础。
高质量科学假说产出
元生v1.3在多角度评估中都表现优越。在生物医学研究问题集上,元生v1.3的标准模式和通用智能体Gemini-3-pro, DeepSeek v3.2,深度调研系统GPT Deep research和生物医药领域专用智能体系统进行了对比。如图3-4所示,在文献引用方面,元生v1.3标准模式的引用正确率显著超越现有方法,在调研过程中的总阅读量上,元生相比提供数据的其他候选系统高出一个数量级。在报告质量方面,基于三款领先的大模型评审员的独立打分,元生v1.3标准模式在五个报告质量维度均优于候选方法。

图3 各模型产生报告的有效参考文献数目对比

图4 科学假说报告效果评测。引用正确率使用CiteTrue(https://citetrue.com/)评价;其他科学假说相关指标参考相关工作[1, 2],其中,充分性衡量对既定科学问题的解决程度;事实依据衡量证据和逻辑的正确性;影响力衡量假说对领域的贡献程度;预期有效性衡量假说和方案达到预期效果的可能性。
多模态理解和可视化升级
元生不仅生成科学假说与分析报告的文字内容,还能自主调用计算工具和可视化工具,动态生成高质量多模态结果图(如图5所示)。自主产生和搜集的可视化图片及其对应的科学证据共同支撑v1.3更丰富的调研报告,帮助元生从以文献和数据为中心走向更广泛的多模态智能体框架。

图5 元生产生的多模态分析结果展示
03
案例展示
1.非天然氨基酸在外泌体领域交叉应用:
用户A:该报告提出非天然氨基酸为外泌体工程化提供了可编程的化学接口,通过代谢掺入与遗传密码扩展技术,实现了生物正交标记、表面功能化、互作捕获和货物强化的四位一体方法学框架。元生整合了生物化学和生物医学两个领域的研究成果,从实验室研究拓展到工业应用层面,有前瞻性,充分体现了跨学科信息整合能力。
2.衰老新假说:
用户B:针对人类衰老的生物学机制,元生提出新概念“Glycan Code Entropy (GCE)”以及相应的调控方式,非常新颖的概念,且支持证据扎实,融合了多个领域的研究成果提出的假说,相信相关领域的科研者看到会眼前一亮。提问中没有引导和倾向性的词语,该假说由元生自主提出,体现了元生产出具有科学性的原创概念假说的能力。
3.疾病相关GPCR分析:
用户C:针对用户提出的靶点调研问题,元生论证了10+个孤儿GPCR和疾病的关联性,证据来源可靠且多源,由元生提出了一套科学合理的靶标打分规则,分析流程也很规范,得出的结果可信,展示了元生基础坚实的系统分析能力。
此外,在实际使用过程中,元生的用户群体发现该平台能够适配从基础生物机制研究到疾病转化策略生成的多类任务,其能力覆盖生物医学研究的各个领域。我们诚挚邀请各位用户共同体验、使用并探索元生的更多可能性。
04
邀请使用
元生系统目前已经全面开放注册体验,欢迎试用:https://origene.lglab.ac.cn/
相关链接
·论文链接:
https://www.biorxiv.org/content/10.1101/2025.06.03.657658v1.full.pdf
·项目主页:
https://gentel-lab.github.io/OriGene-Homepage/
·代码仓库:
https://github.com/GENTEL-lab/OriGene
参考文献

内容中包含的图片若涉及版权问题,请及时与我们联系删除


评论
沙发等你来抢