Sibyl: Simple yet Effective Agent Framework for Complex Real-world Reasoning

2024年07月15日
  • 简介
    现有基于大型语言模型(LLM)的代理展示了强大的问题解决能力,通过整合LLM固有的知识、强大的上下文学习和零-shot能力以及与人类精心设计的LLM调用工作流结合使用的工具。然而,这些代理在长期推理方面仍然存在缺陷,并且未充分利用现有工具的潜力,在复杂的现实推理场景中存在明显的不足。为了解决这些限制,我们介绍了Sibyl,这是一个简单而强大的基于LLM的代理框架,旨在通过有效地利用最小的工具集来处理复杂的推理任务。Sibyl从全局工作空间理论中汲取灵感,引入全局工作空间来增强系统中知识和对话历史的管理和共享。此外,受Mind理论的启发,Sibyl实现了基于多代理辩论的陪审团来自我完善最终答案,确保综合和平衡的方法。这种方法旨在降低系统复杂性,扩大可解决问题的范围-从通常需要人类几分钟解决的问题到需要几小时甚至几天的问题,从而促进从系统1到系统2思考的转变。Sibyl的设计侧重于可扩展性和易于调试,从其创始时就采用了函数式编程中的可重入概念,旨在无缝地低成本集成到其他LLM应用程序中,以提高能力。我们在GAIA基准测试集上的实验结果显示,使用GPT-4实例化的Sibyl代理实现了34.55%的平均得分,比其他基于GPT-4的代理更具有最先进的性能。我们希望Sibyl能够激发更可靠和可重复使用的基于LLM的代理解决方案,以解决复杂的现实推理任务。
  • 图表
  • 解决问题
    Sibyl试图解决长期推理和现有工具潜力不足的问题,以及复杂现实世界推理场景中的缺陷。
  • 关键思路
    Sibyl是一个基于LLM的代理框架,通过高效利用最小的工具集来处理复杂推理任务,实现了全局工作空间和多代理辩论式陪审团的引导。
  • 其它亮点
    Sibyl实现了全局工作空间和多代理辩论式陪审团的引导,以提高系统的管理和共享知识和对话历史。实验结果显示,Sibyl在GAIA基准测试集上的表现优于其他基于GPT-4的代理。
  • 相关研究
    最近的相关研究包括基于LLM的代理,如GPT-3和GPT-4,以及使用多代理系统解决问题的研究。
PDF
原文
点赞 收藏 评论 分享到Link

沙发等你来抢

去评论