- 简介软件工程是一项具有挑战性的任务,需要精通代码生成和与计算机交互的能力。在本文中,我们介绍了SWE-agent,这是一个自主系统,使用语言模型与计算机交互,解决软件工程任务。我们展示了自定义的代理-计算机接口(ACI)极大地增强了代理创建和编辑代码文件、浏览整个代码库和执行程序的能力。在SWE-bench上,SWE-agent能够解决12.5%的问题,而检索增强生成(RAG)的最佳结果为3.8%。我们探讨了ACI设计对代理行为和性能的影响,并提供了有效设计的见解。
- 图表
- 解决问题SWE-agent试图解决软件工程中编写和编辑代码文件、导航整个代码库和执行程序等任务的自动化问题。
- 关键思路SWE-agent使用语言模型与计算机进行交互,通过自定义的agent-computer interface(ACI)大大提高了代理程序的性能。
- 其它亮点论文在SWE-bench上展示了SWE-agent的性能,相比之前最好的retrieval-augmented generation(RAG)方法,SWE-agent的问题解决率达到了12.5%。论文还探讨了ACI设计如何影响代理程序的行为和性能,并提供了有效设计的见解。
- 相关研究包括retrieval-augmented generation(RAG)和其他一些基于语言模型的自动化代码生成方法。
沙发等你来抢
去评论
评论
沙发等你来抢