多个 AI 智能体共同解决化学难题 [译]

"助手型" AI 智能体负责核查文献、阅读设备说明书,以及准备化学实验。

实验室空无一人,因为所有研究人员都在公园里休息,而 AI 正在完成他们的工作。
实验室空无一人,因为所有研究人员都在公园里休息,而 AI 正在完成他们的工作。

尽管人工智能技术飞速发展,但 AI 目前还无法完全替代人类从事科学研究。然而,这并不意味着 AI 不能在一些日常的科学实验工作中提供自动化的帮助。举个例子,就在几年前,研究人员就已经让 AI 控制自动化实验室设备,并成功让它全面记录所有可能发生的化学反应

虽然这种方法很有效,但最初设立这个系统时仍需要研究人员大量的干预。现在,卡内基梅隆大学的一个团队已经探索出了一种方法,让 AI 系统能够自行学习如何进行化学操作。这个系统需要三个专门化的 AI 智能体,每个负责不同的任务。一旦设置完成并提供了所需原料,你只需告诉它你想进行的反应类型,它就能自行解决了。

人工智能三合一体系

研究人员关注的是大语言模型(LLMs)能为科学研究带来哪些能力。因此,他们在这项研究中主要使用了诸如 GPT-3.5 和 GPT-4 这样的大语言模型,同时也测试了 Claude 1.3 和 Falcon-40B-Instruct 等其他模型。(其中 GPT-4 和 Claude 1.3 表现最优。)但是,他们并没有依赖单一的系统来完成化学领域的所有工作,而是设置了几个不同的模块,这些模块在工作分配上互相配合,共同构成了一个名为“Coscientist”的系统。

a, Coscientist 由多个模块组成,这些模块可以交换信息。蓝色背景的方框代表 LLM 模块,规划模块显示为绿色,输入提示为红色。白色方框代表不使用 LLM 的模块。b, 实验类型,展示使用单个模块或模块组合时的能力。c, 带液体处理装置的实验装置图片。UV-Vis,紫外可见光。
a, Coscientist 由多个模块组成,这些模块可以交换信息。蓝色背景的方框代表 LLM 模块,规划模块显示为绿色,输入提示为红色。白色方框代表不使用 LLM 的模块。b, 实验类型,展示使用单个模块或模块组合时的能力。c, 带液体处理装置的实验装置图片。UV-Vis,紫外可见光。

他们使用了以下三个模块:

  1. 网络搜索器(Web searcher): 这个模块有两项核心功能:一是利用 Google 的搜索 API 来寻找可能含有有用信息的网页;二是获取这些网页的内容并从中提取信息,这有点像 ChatGPT 在对话早期部分维持的上下文,帮助它更好地回答后续问题。研究者可以追踪这个模块花费时间的地方,发现它访问的页面中大约一半是维基百科。此外,它最常访问的网站前五名包括了美国化学学会和英国皇家化学学会发布的期刊。

  2. 文档搜索器(Documentation searcher): 可以把这个模块看作是用于“查阅手册”的 AI。它将控制各种实验室自动化设备,比如机器人流体处理器,这些设备通常是通过专门的命令或类似 Python 语言的接口来控制的。这个 AI 模块可以访问所有这些设备的使用手册,以便了解如何操作它们。

  3. 规划器(Planner): 规划器可以向其他两个 AI 模块发出指令并处理它们的回应。它能够在一个 Python 编程环境中执行代码,从而进行各种计算。它还能操作自动化实验室设备,亲自进行和分析实验。因此,规划器就像是一个化学家,它从文献中学习,并尝试使用实验设备来应用所学的知识。

    规划器还能识别软件错误,无论是它的 Python 脚本还是操作自动化硬件时的错误,并据此进行修正。

实践中的系统应用

这个系统最初的任务是合成一些常见的化学物质,比如对乙酰氨基酚(acetaminophen)和布洛芬(ibuprofen)。通过在网络和科学文献中搜索,它基本能够找到可行的合成路径。这就引出了一个问题:这个系统是否能够充分理解它所能使用的硬件,以实际应用它的理论知识。

研究人员从一个简单的实验开始:他们使用了一个标准的样品盘,上面有许多小井,排列成矩形网格。他们让系统用不同颜色的液体在盘上填充方格、对角线条纹或其他图案,结果系统做得非常好。

接下来的实验更有挑战性。研究人员在小井网格中随机放置了三种不同颜色的溶液,并让系统识别每个小井的颜色。起初,这个名为“Coscientist”的系统不知道如何完成这项任务。但在提醒它不同颜色的溶液会有不同的吸收光谱后,它利用了自己可用的光谱仪,成功地识别了不同颜色的溶液。

在基础的命令控制看似无误之后,研究人员决定进行一些化学实验。他们准备了一个装有各种简单化学物质和催化剂的样品盘,让系统进行一个特定的化学反应。Coscientist 在化学方面做得很对,但在实际操作时遇到了困难,因为它向控制加热和搅拌的硬件发送了错误的命令。这迫使它回到了文档模块进行调整,最终成功完成了化学反应。

实验取得了成功。通过光谱分析,研究人员在反应混合物中发现了目标产物的特征光谱,并通过色谱技术进一步证实了这些产物的存在。

优化

在初步反应顺利实现后,研究人员进一步要求系统提升反应效率。他们将优化过程设计成一场游戏,反应产量越高,得分也随之上升。

系统在第一轮测试反应中曾做出一些不理想的判断,但很快便锁定了更高的产量。研究人员还发现,他们可以通过提供一些随机初始混合物的产量信息给 Coscientist(Coscientist),从而避免第一轮中的失误选择。这表明无论 Coscientist 是从自己的反应中获得信息,还是从外部信息源,它都能将这些信息融入其规划中。

研究人员总结,Coscientist 拥有以下几项显著能力:

  • 利用公开信息规划化学合成
  • 浏览和处理复杂硬件的技术手册
  • 运用这些知识控制各种实验室设备
  • 将这些操作硬件的能力整合到实验室工作流程中
  • 分析自身的反应并据此设计改进的反应条件。

从多个方面来看,这似乎类似于研究生第一年的学习经历。理想情况下,研究生们会逐步深入学习。但也许 GPT-5 同样能够做到这一点。

更值得深思的是,Coscientist 的结构依靠多个专业系统的互动,这与大脑的运作方式颇为相似。当然,大脑的专业系统能够执行更广泛的活动,且种类更多。但这种结构可能是实现更复杂行为的关键因素。

不过,研究人员也对 Coscientist 的某些功能表示担忧。有很多化学物质(比如神经毒气),我们不希望看到它们更容易合成。而如何告诉 GPT 实例不要做某些事情,也成了一个持续的挑战。

Nature, 2023. DOI: 10.1038/s41586-023-06792-0  (关于 DOI)。