- 简介基于大型语言模型的智能代理已经展现出在加速科学发现方面的巨大潜力,这些代理利用其丰富的背景知识和推理能力。在这里,我们开发了BioDiscoveryAgent,这是一个代理,它可以设计新的实验,推理其结果,并高效地导航假设空间以达到期望的解决方案。我们在设计基因扰动实验的问题上展示了我们的代理,其中目标是从许多可能的基因中找到一个小的子集,当扰动时,会导致特定的表型(例如,细胞生长)。BioDiscoveryAgent利用其生物学知识,可以独特地设计新的实验,而无需训练机器学习模型或明确设计采集函数。此外,与专门针对此任务训练的现有贝叶斯优化基线相比,BioDiscoveryAgent在检测期望表型方面的平均改进达到18%。我们的评估包括一个未发表的数据集,确保它不是语言模型的训练数据的一部分。此外,BioDiscoveryAgent预测基因组合的扰动精度是随机基线的两倍,这是在闭环实验设计的背景下尚未探索的任务。该代理还可以访问搜索生物医学文献的工具,执行代码以分析生物数据集,并提示另一个代理对其预测进行批判性评估。总的来说,BioDiscoveryAgent在每个阶段都是可解释的,代表了一种可访问的新范式,在计算生物学实验设计方面具有增强科学家能力的潜力。
- 图表
- 解决问题设计新实验、推理实验结果和高效导航假设空间以达到预期解决方案的目的。在设计基因扰动实验时,找到一小部分基因,当这些基因被扰动时,会导致特定表型(如细胞生长)。
- 关键思路利用大型语言模型的背景知识和推理能力,开发出一种名为BioDiscoveryAgent的代理程序,用于设计新实验、推理实验结果和高效导航假设空间以达到预期解决方案的目的。BioDiscoveryAgent可以独特地设计新实验,而无需训练机器学习模型或显式设计获取函数。
- 其它亮点BioDiscoveryAgent在五个数据集中实现了预期表型的平均改进率达到18%,相比于专门针对此任务训练的贝叶斯优化基线。此外,BioDiscoveryAgent的基因组合扰动预测比随机基线提高了两倍的准确性。BioDiscoveryAgent还具有搜索生物医学文献、执行代码以分析生物数据集以及提示另一个代理程序对其预测进行评估的工具。
- 最近的相关研究包括“使用深度学习模型进行基因扰动预测”和“使用贝叶斯优化在生物学中进行实验设计”。
沙发等你来抢
去评论
评论
沙发等你来抢