COLT: Towards Completeness-Oriented Tool Retrieval for Large Language Models

2024年05月25日
  • 简介
    最近,将外部工具与大型语言模型(LLM)集成已经成为克服预训练数据固有限制的有前途的方法。然而,实际应用通常涉及各种各样的工具,直接将所有工具都纳入LLM中是不可行的,因为存在输入长度和响应时间的限制。因此,为了充分利用增强工具的LLM的潜力,开发有效的工具检索系统至关重要。现有的工具检索方法主要依赖于用户查询和工具描述之间的语义匹配,这通常会导致选择冗余的工具。因此,这些方法无法提供解决LLM遇到的多方面问题所需的完整多样化工具集。在本文中,我们提出了一种新颖的模型无关的基于协作学习的工具检索方法COLT,它不仅捕捉用户查询和工具描述之间的语义相似性,还考虑了工具之间的协作信息。具体而言,我们首先微调基于PLM的检索模型,以在语义学习阶段捕捉查询和工具之间的语义关系。随后,我们在查询、场景和工具之间构建三个二分图,并引入双视图图协作学习框架,在协作学习阶段捕捉工具之间错综复杂的协作关系。在开放基准测试和新引入的ToolLens数据集上进行的广泛实验表明,COLT实现了卓越的性能。值得注意的是,我们提出的模型框架下的BERT-mini(11M)的性能超过了参数多30倍的BERT-large(340M)。此外,我们计划公开发布ToolLens数据集,以支持进一步的工具检索研究。
  • 图表
  • 解决问题
    本文旨在解决大型语言模型(LLMs)与外部工具集成面临的问题,即如何选择最佳的工具来帮助LLMs解决多方面的问题。
  • 关键思路
    本文提出了一种新的基于协同学习的工具检索方法,COLT,该方法不仅考虑了用户查询和工具描述之间的语义相似性,还考虑了工具之间的协同信息。
  • 其它亮点
    本文的实验结果表明,COLT在公开基准测试和新引入的ToolLens数据集上均取得了优异的性能。此外,本文还计划公开ToolLens数据集以支持进一步的研究。
  • 相关研究
    近期的相关研究包括:'Learning to Retrieve Reasoning Paths over Wikipedia Graph for Question Answering','A Hybrid Approach to Answering Complex Questions on Knowledge Bases'等。
PDF
原文
点赞 收藏 评论 分享到Link

沙发等你来抢

去评论