SWE-agent: Agent-Computer Interfaces Enable Automated Software Engineering

简介

软件工程是一项具有挑战性的任务，需要精通代码生成和与计算机交互的能力。在本文中，我们介绍了SWE-agent，这是一个自主系统，使用语言模型与计算机交互，解决软件工程任务。我们展示了自定义的代理-计算机接口（ACI）极大地增强了代理创建和编辑代码文件、浏览整个代码库和执行程序的能力。在SWE-bench上，SWE-agent能够解决12.5%的问题，而检索增强生成（RAG）的最佳结果为3.8%。我们探讨了ACI设计对代理行为和性能的影响，并提供了有效设计的见解。
作者讲解

目前尚无作者解读视频，你可点击下方【许愿开讲】按钮，许愿作者开讲~
图表
解决问题

SWE-agent试图解决软件工程中编写和编辑代码文件、导航整个代码库和执行程序等任务的自动化问题。
关键思路

SWE-agent使用语言模型与计算机进行交互，通过自定义的agent-computer interface（ACI）大大提高了代理程序的性能。
其它亮点

论文在SWE-bench上展示了SWE-agent的性能，相比之前最好的retrieval-augmented generation（RAG）方法，SWE-agent的问题解决率达到了12.5%。论文还探讨了ACI设计如何影响代理程序的行为和性能，并提供了有效设计的见解。
相关研究

相关研究包括retrieval-augmented generation（RAG）和其他一些基于语言模型的自动化代码生成方法。