Agent-E: From Autonomous Web Navigation to Foundational Design Principles in Agentic Systems

向作者提问

NEW

简介

AI代理正在改变消费者和企业领域的工作方式。然而，构建高度能力的代理或多代理系统的设计模式和架构仍在发展中，对各种设计选择和算法的影响的理解仍在不断发展。在本文中，我们介绍了我们构建一个新型网络代理——Agent-E的工作。Agent-E相比之前的最先进的网络代理引入了许多架构改进，如分层架构、灵活的DOM精炼和去噪方法以及“变化观察”概念，以指导代理向更准确的性能方向发展。我们首先介绍了在WebVoyager基准数据集上对Agent-E进行评估的结果，并展示Agent-E在大多数类别上比其他SOTA文本和多模式网络代理在这个基准上提高了10-30\%。然后，我们将从Agent-E的开发中汇总出的经验融合到开发代理系统的一般设计原则中。这些原则包括使用特定于领域的原始技能，精炼和去噪环境观测的重要性，分层架构的优势以及代理自我改进的作用，以增强代理的效率和功效，同时代理积累经验。
作者讲解

目前尚无作者解读视频，你可点击下方【许愿开讲】按钮，许愿作者开讲~
图表
解决问题

本论文旨在构建一个新型的网络代理-Agent-E，解决网络代理系统中存在的问题，并提出一些通用的设计原则。
关键思路

Agent-E引入了许多架构上的改进，包括分层架构、灵活的DOM提取和去噪方法以及“变化观察”概念等，以提高代理的性能和准确性。同时，论文总结了一些通用的设计原则，如使用特定领域的基本技能、对环境观察进行提取和去噪、分层架构的优势以及代理自我改进的作用。
其它亮点

论文通过对WebVoyager基准数据集的评估表明，Agent-E在大多数类别中比其他SOTA文本和多模态网络代理表现更好，优势达到了10-30％。此外，论文还开源了Agent-E的代码。
相关研究

最近的相关研究包括：1.《Towards Building Large-Scale Agentive Systems》；2.《Designing Agentive Technology: AI That Works for People》；3.《Multi-Agent Systems: Algorithmic, Game-Theoretic, and Logical Foundations》等。

许愿开讲

PDF

原文

点赞收藏

向作者提问

NEW

分享到Link

提问交流

提交问题，平台邀请作者，轻松获得权威解答～

向作者提问