- 简介基于大语言模型(LLM-based)的多智能体系统(MAS)正日益被用于通过角色专业化与协同合作来拓展智能体的问题求解能力。MAS 的工作流可自然建模为有向计算图:其中节点执行各类智能体或子工作流,边则刻画节点间的依赖关系与消息传递机制。然而,在当前主流框架中实现复杂图结构工作流仍需大量人工编码,组件复用性差,且难以灵活集成异构的外部上下文信息源。为克服上述局限,我们提出了 MASFactory——一个以图为中心的 LLM 多智能体系统编排框架。该框架引入“氛围图构建”(Vibe Graphing)方法,这是一种以人为中心(human-in-the-loop)的流程:首先将用户以自然语言表达的意图自动编译为可编辑的工作流规范,再进一步转换为可执行的计算图。此外,MASFactory 提供了可复用的功能组件、支持即插即用的上下文集成能力,并配备可视化工具,支持工作流拓扑预览、运行时追踪以及人机协同交互。我们在七个公开基准测试任务上对 MASFactory 进行了系统评估,既验证了其对代表性 MAS 方法的复现一致性,也证实了 Vibe Graphing 方法的有效性。本工作的全部代码(https://github.com/BUPT-GAMMA/MASFactory)及演示视频(https://youtu.be/ANynzVfY32k)均已开源发布。
-
- 图表
- 解决问题现有LLM-based多智能体系统(MAS)框架在构建复杂工作流时依赖大量手工编码,缺乏可复用性、难以集成异构外部上下文源,且工作流建模与调试过程不直观、不可编辑。这不是全新问题,但当前主流框架(如AutoGen、CrewAI、LangGraph)仍未能系统性解决可编辑性、人机协同编译、上下文即插即用等工程化瓶颈。
- 关键思路提出MASFactory——一个以有向计算图为核心的MAS编排框架;核心创新是Vibe Graphing:一种人类在环(human-in-the-loop)方法,将自然语言意图(如‘先让研究员检索论文,再让评审员打分,最后由协调员汇总’)自动编译为可编辑的结构化工作流规范(JSON/YAML),再生成可执行图;强调‘意图→可编辑规范→可执行图’的三层抽象,区别于端到端黑箱编译或纯代码定义范式。
- 其它亮点1)在7个公开基准(含AgentBench、Multi-Agent Alpaca、HotpotQA协作版等)上验证了对代表性MAS方法(如Role-Based Debate、Chain-of-Debate)的精确复现能力;2)提供开箱即用的可重用Agent组件库(检索、推理、校验等)和标准化Context Adapter接口(支持API、数据库、RAG模块即插即用);3)内置交互式可视化工具,支持拓扑预览、运行时消息追踪、节点级人工干预(如重试/覆盖输出);4)全部代码开源(GitHub)、含演示视频;5)未来方向包括:Vibe Graphing的零样本泛化能力提升、跨图工作流组合、以及与LLM推理引擎(如vLLM)深度协同优化。
- AutoGen (Microsoft, 2023); LangGraph (LangChain, 2024); CrewAI (2023); AgentScope (Tsinghua, 2024); GraphRAG (Microsoft, 2024); Multi-Agent Reinforcement Learning for Workflow Orchestration (NeurIPS 2023 Workshop); LLM-Based Process Mining with Graph Abstraction (ACL 2024)
- 1
NEW
提问交流
提交问题,平台邀请作者,轻松获得权威解答~
向作者提问

提问交流