MASAI: Modular Architecture for Software-engineering AI Agents

简介

我们在软件工程中解决复杂问题的常见方法是将问题分解为多个子问题。受此启发，我们提出了一种软件工程AI（MASAI）代理的模块化架构，其中使用不同的LLM动力子代理实例化，这些子代理具有明确定义的目标和策略，以实现这些目标。我们的模块化架构提供了几个优点：（1）在子代理之间使用和调整不同的问题解决策略，（2）使子代理能够从分散在存储库中的不同来源收集信息，（3）避免不必要的长路径，从而增加成本并添加无关的上下文。 MASAI使我们能够在由11个Python存储库中的300个GitHub问题组成的流行且极具挑战性的SWE-bench Lite数据集上实现最高性能（28.33％的解决率）。我们对MASAI进行了全面评估，相对于其他代理方法进行了分析，并分析了我们的设计决策及其对MASAI成功的贡献。
作者讲解

目前尚无作者解读视频，你可点击下方【许愿开讲】按钮，许愿作者开讲~
图表
解决问题

提出了一种基于模块化架构的软件工程人工智能代理（MASAI）来解决复杂问题，特别是在GitHub问题解决方案中的应用。
关键思路

将问题分解为多个子问题，并使用不同的LLM-powered子代理来解决这些子问题，从而实现高效的问题解决。
其它亮点

通过使用MASAI代理在SWE-bench Lite数据集上实现了最高的解决率（28.33％）。实验设计详细，使用了多个Python库的300个GitHub问题。该论文提出的MASAI架构具有可扩展性和灵活性，值得进一步研究。
相关研究

在最近的研究中，也有一些使用代理来解决软件工程问题的论文，例如“基于深度强化学习的软件缺陷预测”和“自适应代理系统用于软件过程优化”。

MASAI: Modular Architecture for Software-engineering AI Agents

提问交流

提问交流