Enhancing Tool Retrieval with Iterative Feedback from Large Language Models

2024年06月25日
  • 简介
    工具学习旨在通过外部工具增强和扩展大型语言模型(LLMs)的能力,近来引起了广泛关注。目前的方法表明,LLMs可以通过上下文学习或微调有效地处理一定数量的工具。然而,在实际场景中,工具的数量通常是庞大的且更新不规则,这强调了需要一个专门的工具检索组件。由于以下挑战,工具检索是非常棘手的:1)复杂的用户说明和工具描述;2)工具检索和工具使用模型之间的不对齐。为了解决上述问题,我们提出了通过大型语言模型的迭代反馈来增强工具检索的方法。具体而言,我们提示工具使用模型(即LLM)在多轮中为工具检索器模型提供反馈,这可以逐步改善工具检索器对说明和工具的理解,并减少两个独立组件之间的差距。我们建立了一个统一而全面的基准来评估工具检索模型。广泛的实验表明,我们提出的方法在域内评估和域外评估中均取得了先进的性能。
  • 图表
  • 解决问题
    提高大型语言模型的工具检索能力,解决复杂用户指令和工具描述、工具检索和使用模型不匹配等问题。
  • 关键思路
    通过迭代反馈,利用大型语言模型的工具使用模型为工具检索模型提供指导,逐步提高工具检索模型的理解能力和性能。
  • 其它亮点
    论文提出了一种基于迭代反馈的工具检索方法,并建立了统一的评估基准。实验结果表明,该方法在领域内和领域外的评估中都取得了优异的性能。
  • 相关研究
    近期的相关研究包括:《Fine-grained Entity Typing via Hierarchical Few-shot Learning》、《Few-shot Learning with Contrastive Learning for Dialog State Tracking》等。
PDF
原文
点赞 收藏 评论 分享到Link

沙发等你来抢

去评论