Agent-E: From Autonomous Web Navigation to Foundational Design Principles in Agentic Systems

2024年07月17日
  • 简介
    AI代理正在改变消费者和企业领域的工作方式。然而,构建高度能力的代理或多代理系统的设计模式和架构仍在发展中,对各种设计选择和算法的影响的理解仍在不断发展。在本文中,我们介绍了我们构建一个新型网络代理——Agent-E的工作。Agent-E相比之前的最先进的网络代理引入了许多架构改进,如分层架构、灵活的DOM精炼和去噪方法以及“变化观察”概念,以指导代理向更准确的性能方向发展。我们首先介绍了在WebVoyager基准数据集上对Agent-E进行评估的结果,并展示Agent-E在大多数类别上比其他SOTA文本和多模式网络代理在这个基准上提高了10-30\%。然后,我们将从Agent-E的开发中汇总出的经验融合到开发代理系统的一般设计原则中。这些原则包括使用特定于领域的原始技能,精炼和去噪环境观测的重要性,分层架构的优势以及代理自我改进的作用,以增强代理的效率和功效,同时代理积累经验。
  • 作者讲解
  • 图表
  • 解决问题
    本论文旨在构建一个新型的网络代理-Agent-E,解决网络代理系统中存在的问题,并提出一些通用的设计原则。
  • 关键思路
    Agent-E引入了许多架构上的改进,包括分层架构、灵活的DOM提取和去噪方法以及“变化观察”概念等,以提高代理的性能和准确性。同时,论文总结了一些通用的设计原则,如使用特定领域的基本技能、对环境观察进行提取和去噪、分层架构的优势以及代理自我改进的作用。
  • 其它亮点
    论文通过对WebVoyager基准数据集的评估表明,Agent-E在大多数类别中比其他SOTA文本和多模态网络代理表现更好,优势达到了10-30%。此外,论文还开源了Agent-E的代码。
  • 相关研究
    最近的相关研究包括:1.《Towards Building Large-Scale Agentive Systems》;2.《Designing Agentive Technology: AI That Works for People》;3.《Multi-Agent Systems: Algorithmic, Game-Theoretic, and Logical Foundations》等。
许愿开讲
PDF
原文
点赞 收藏
向作者提问
NEW
分享到Link

提问交流

提交问题,平台邀请作者,轻松获得权威解答~

向作者提问