4分钟成功复现诺奖！CMU开发GPT-4化学家，自主编码操控机器人颠覆化学研究登Nature

新智元报道

编辑：桃子润

【新智元导读】AI颠覆化学研究再次登上Nature！由CMU和Emerald Cloud Lab团队开发的GPT-4加持的AI工具，在不到4分钟的时间成功复现2010年诺奖研究成果。

ChatGPT大模型爆火这一年，没想到竟颠覆了整个化学领域。

先是谷歌DeepMind的AI工具GNoME成功预测出200万种晶体结构，随后微软推出的MatterGen，大大加速了设计所需材料特性的速度。

今天，CMU和Emerald Cloud Lab的研究团队开发了一种全新自动化AI系统——Coscientist，荣登Nature。

它可以设计、编码和执行多种反应，完全实现了化学实验室的自动化。

实验评测中，Coscientist利用GPT-4，在人类的提示下检索化学文献，成功设计出一个反应途径来合成一个分子。

GPT-4遍历整个互联网上的说明书，并选择数据库中最好的试剂盒和试剂，在现实中制造分子。

论文地址：https://www.nature.com/articles/s41586-023-06792-0

最令人震惊的是，Coscientist在短短4分钟内，一次性复现了诺奖研究。

具体来说，全新AI系统在6个不同任务中呈现了加速化学研究的潜力，其中包括成功优化「钯催化偶联反应」。

「钯催化偶联反应」的研究是由美国化学家Richard Fred Heck，以及两位日本化学家获得了2010年诺贝尔化学奖。

领导这项研究的CMU化学家Gabe Gome表示，「当我看到一种非有机智能能够自主计划、设计和执行人类发明的化学反应的那一刻，真是太神奇了」！

GPT-4自动化学研究

当前，AI工具在科学领域的应用激增，但对于在实验室工作的研究人员，或那些不精通代码的人来说，AI并非唾手可得。

我们都知道，化学研究建立在迭代循环的基础上。在这个循环中，实验被设计、执行，然后进行改进以实现特定目标。

对于化学家来说，所做的研究是多管齐下的——不仅需要执行化学反应的技术技能，还需要规划和设计化学反应的知识。

举个栗子，当合成一个新物质时，化学家们需要「逆合成分析」，从最后的目标物质一步一步想回去，以确定初始的分子，然后在数据库中搜索合适的反应条件，并选出一条最可能成功的合成路线。

但是，在实际的实验中就会发现，化学反应通常无法按预期高产率和选择性得出产物。

这时，还得需要重新搜索文献、设计新的实验路线、再次尝试实验，整个迭代过程就会变得遥遥无期。

对于人类化学家来说，即便有了相应的知识，要想设计和执行一个化学反应也不是一件容易的事情，因为设计出的化学反应往往很难以理想的速率来生成产物。

当OpenAI在3月份放出GPT-4后，Gomes和团队成员开始思考，如何让大模型为化学家服务。

Gomes表示，「Coscientist却可以做真正训练有素的化学家可以做的大部分事情。」

当人类科学家要求Coscientist合成一个特定的分子时，它会在互联网上搜索以设计合成路线，然后为所需的反应设计实验方案。

在获得具体的实验方案以后，它能编写代码来指示移液工作站，然后运行代码，让机器人执行它编程过的任务。

而真正厉害的是，Coscientist还可以从反应的结果中学习，并建议对协议进行更改以进行改进。

这种迭代循环优化了反应，从而能够实现预期的实验目标。

AI编写代码，控制化学机器人

显然，当前高科技化学机器人通常是由人类化学家编写的计算机代码来控制。

而Coscientist系统首次实现，由AI编写的计算机代码控制机器人。

研究人员首先让Coscientist去完成一些简单的任务，控制一台机器人液体处理机，将有色液体分配到一个包含96个网格排列的小孔的盘子中。

它被要求「每隔一行滴上一种颜色」，「画一条蓝色的对角线」，「用黄色绘制一个3x3的矩形」，「画一个红叉」等等。

Coscientist被指示用液体处理机器人进行不同的设计

液体处理机仅是一个初试，团队人员通过Emerald Cloud Lab实验室合作，还将Coscientist引入了更多类型的机器人设备，

这家实验室配备了各种自动化仪器，包括测量被化学样品吸收的光波长的分光计。

一个盘子里面装着3种不同颜色（红黄蓝）的液体，Coscientist被要求确定这些液体是什么颜色，以及它们在盘子上的什么位置。

Coscientist没有「眼睛」，只能通过编写代码，将神秘的色板自动传递给分光光度计，并分析每个孔吸收的光的波长，从而识别出有哪些颜色，及其在色板上的位置。

对于这项任务，研究人员不得不稍微给Coscientist一点提示，指示它考虑不同颜色吸收光的方式。

剩下的任务，就可完全放心交给AI系统去完成。

由Coscientist生成的代码。分为以下几个步骤：定义方法的元数据、加载实验器皿模块、设置液体处理器、执行所需的试剂转移、设置加热器-振动器模块、运行反应以及关闭模块。

4分钟复现诺奖，自主纠正代码错误

Coscientist的终极测试是，将其组装的模块和训练放在一起，以完成研究团队执行「Suzuki和Sonogashira反应」的命令。

这种反应是在20世纪70年代发现的，使用金属钯作为催化剂，在有机分子中的碳原子之间形成键。

事实证明，这些反应在生产治疗炎症、哮喘和其他疾病的新型药物方面非常有用。它们还用于有机半导体，以及许多智能手机和显示器中的有机发光二极管。

值得一提的是，这些突破性的反应及其广泛的影响得到了正式认可，2010年诺贝尔奖便授予了Sukuzi、Richard Heck和Ei-ichi Negishi。

当然，Coscientist以前从未尝试过这些反应。

MacKnight表示，设计了Coscientist搜索技术文档的软件模块，「对我来说，最惊艳的时刻是看到它问了所有正确的问题。」

Coscientist主要在维基百科上寻找答案，也还有许多其他网站，包括美国化学学会、皇家化学学会和其他包含描述Suzuki和Sonogashira反应的学术论文的网站。

钯催化偶联反应整个流程

在不到4分钟的时间里，Coscientist设计了一个使用团队提供的化学物质产生所需反应的准确程序。

当它试图用机器人在现实世界中执行程序时，它在编写的代码中「犯了一个错误」，该代码用来控制加热和摇动液体样品的设备。

但是在没有人的提示的情况下，Coscientist立即发现了问题，重新参考了设备的技术手册，更正了代码并再次尝试。

实验结果被装在了几个极小的透明液体样本中。Boiko分析了样品，发现了铃木反应和Sonogashira反应的光谱特征。

当Boiko和MacKnight告诉Gomes Coscientist的成果时，Gomes表示怀疑。

「我以为他们在跟我开玩笑，」他回忆道。

但是成果就放在那里，简直让人难以置信。

「随之而来的是明智地使用这种潜在的力量，并防止滥用。」Gomes说，了解人工智能的能力和限制是制定知情规则和政策的第一步，这些规则和政策可以有效地防止有害的人工智能使用，无论是故意的还是意外的。

Coscientist基本架构

研究人员提出了一个基于多LLM的智能代理（以下简称为 Coscientist），它能够自主设计、规划和执行复杂的科学实验。Coscientist 可以使用工具浏览互联网和相关文档，使用机器人实验应用编程接口（API），并利用其他 LLM 完成各种任务。

研究人员展示了 Coscientist 在以下六项任务中的多功能性和性能：

（1）使用公开数据规划已知化合物的化学合成；

（2）高效搜索和浏览大量硬件文档；

（3）使用文档在云实验室中执行高级命令；

（4）使用底层指令精确控制液体处理仪器；

（5）处理需要同时使用多个硬件模块和整合不同数据源的复杂科学任务；

（6）解决需要分析以前收集的实验数据的优化问题。

科学家「通过与多个模块的交互（网络和文档搜索、代码执行）和实验」，获取解决复杂问题所需的知识。

主模块（规划者）的目标是根据用户输入，通过调用下面定义的命令进行规划。

规划器是一个GPT-4聊天实例，扮演助手的角色。用户的初始输入和命令输出被视为给规划器的用户信息。规划器的系统提示（定义 LLM 目标的静态输入）以模块化方式设计，描述为定义操作空间的四个命令:「GOOGLE」、「PYTHON」、「DOCUMENTATION 」和「EXPERIMENT」。

规划器根据需要调用这些命令来收集知识。GOOGLE命令负责使用网络搜索模块搜索互联网，该模块本身也是一个 LLM。

PYTHON命令允许规划者使用「代码执行」模块进行计算，为实验做准备。

EXPERIMENT命令通过DOCUMENTATION模块描述的API实现「自动化」。

与GOOGLE命令一样，DOCUMENTATION命令也是从源头向主模块提供信息，这里指的是有关所需API的文档。

研究人员演示了与Opentrons Python API 和翡翠云实验室（ECL）符号实验室语言（SLL）的兼容性。这些模块共同组成了Coscientist，它可以接收来自用户的简单纯文本输入提示（例如，「执行多个铃木反应」）。上图完整地展示了这一架构。

此外，有些命令还可以使用子反应。

GOOGLE命令能够将提示转化为适当的网络搜索查询，在谷歌搜索API中运行这些查询，浏览网页并将答案反馈给规划器。

同样，DOCUMENTATION命令可检索和汇总必要的文档（例如，机器人液体处理器或云实验室），以便规划器调用 EXPERIMENT命令。

PYTHON命令使用一个隔离的Docker容器执行代码（不依赖于任何语言模型），以保护用户的机器免受规划器要求的任何意外操作的影响。

重要的是，规划器背后的语言模型可以在软件出错时修复代码。这同样适用于自动化模块的EXPERIMENT 命令，该命令可在相应硬件上执行生成的代码，或为手动实验提供合成程序。

AI让每个人都能成为科学家

自然界的大小和复杂性几乎是无限的，无数新的科学发现有待人类突破。

想象一下，新的超导材料可以显著提高能源效率，或者化合物可以治愈原本无法治愈的疾病，延长人类的寿命。

然而，获得取得这些突破所需的教育和培训是一段漫长而艰巨的旅程，成为一名科学家实在是太难了。

但是Gomes和他的团队设想，像Coscientist这样的人工智能辅助系统是一种解决方案，可以为全世界大量提供「AI科学家」来满足科研的人力需求。

人类科学家也需要休息，睡眠。而人类引导的人工智能可以全天候地「科研」。

「自主运行的AI系统可以发现新现象、新反应、新想法」。

科学上有一个反复尝试、失败、学习和改进的过程，人工智能可以大大加快这一过程。

「这可以显著降低几乎任何领域的准入门槛」Gomes说。例如，如果一位未受过「钯催化偶联反应」训练的生物学家想以一种新的方式探索反应的用途，他们可以请Coscientist帮助他们计划实验。

参考资料：

https://www.nature.com/articles/d41586-023-04073-4

内容中包含的图片若涉及版权问题，请及时与我们联系删除

4分钟成功复现诺奖！CMU开发GPT-4化学家，自主编码操控机器人颠覆化学研究登Nature

新智元报道

【新智元导读】AI颠覆化学研究再次登上Nature！由CMU和Emerald Cloud Lab团队开发的GPT-4加持的AI工具，在不到4分钟的时间成功复现2010年诺奖研究成果。

评论列表

评论