Lumos: Learning Agents with Unified Data, Modular Design, and Open-Source LLMs

2023年11月09日
  • 简介
    我们介绍了Lumos,这是一个新颖的框架,用于训练语言代理,采用统一的数据格式和基于开源大型语言模型(LLM)的模块化架构。Lumos由三个不同的模块组成:规划、基础和执行。规划模块将任务分解为一系列高级的、与工具无关的子目标,这些子目标随后由基础模块通过一组低级动作进行具体化。这些动作随后由执行模块执行,利用各种现成的工具和API。为了有效地训练这些模块,收集了高质量的子目标和动作注释,并可用于微调开源LLM以完成各种任务,如复杂问题回答、Web任务和数学问题。利用这种统一的数据和模块化设计,Lumos不仅实现了与当前最先进的代理相当或更好的性能,而且表现出了几个关键优势:(1)Lumos在复杂问题回答和Web任务方面超越了基于GPT-4/3.5的代理,在数学任务上与大得多的LLM代理的性能相当;(2)Lumos的表现优于通过传统训练方法创建的开源代理和使用思维链训练的代理;(3)Lumos能够有效地推广到未见过的交互任务,优于更大的基于LLM的代理,甚至超过了专门的代理的性能。
  • 图表
  • 解决问题
    Lumos框架旨在解决训练语言代理的问题,通过使用统一的数据格式和基于开源大型语言模型的模块化架构来提高代理的性能。
  • 关键思路
    Lumos框架包括三个模块:规划、基础和执行。规划模块将任务分解为一系列高级、工具无关的子目标,然后通过基础模块将其具体化为一组低级操作。这些操作随后由执行模块执行,利用各种现成的工具和API。
  • 其它亮点
    论文通过收集高质量的子目标和操作注释,为各种任务(如复杂问题回答、Web任务和数学问题)的开源LLM进行微调,从而有效地训练这些模块。Lumos不仅在复杂问题回答和Web任务方面超过了基于GPT-4/3.5的代理,而且在数学任务方面与显著更大的LLM代理的性能相当。Lumos还优于通过传统训练方法和链式思考训练创建的开源代理。Lumos能够有效地推广到看不见的交互任务,优于更大的基于LLM的代理,甚至超过了专门的代理。
  • 相关研究
    相关论文:1. GPT-4: A 10,000 Trillion Parameter Language Model by OpenAI, 2. Chain-of-Thoughts: Understanding Sequence-to-Sequence Models with Chain-of-Reasoning by Facebook AI Research, 3. OpenAI GPT-3: Language Models are Few-Shot Learners by OpenAI.
PDF
原文
点赞 收藏 评论 分享到Link

沙发等你来抢

去评论