Open Deep Search: Democratizing Search with Open-source Reasoning Agents

2025年03月26日
  • 简介
    我们推出了开放深度搜索(ODS),旨在缩小专有搜索AI解决方案(例如Perplexity的Sonar Reasoning Pro和OpenAI的GPT-4o Search Preview)与其开源替代品之间日益扩大的差距。ODS的主要创新点在于,通过引入能够明智地使用网络搜索工具来回答问题的推理代理,增强最新开源大语言模型(LLM)的推理能力。具体来说,ODS由两个与用户选择的基础LLM协同工作的组件构成:开放搜索工具(Open Search Tool)和开放推理代理(Open Reasoning Agent)。开放推理代理负责解析给定任务,并通过协调一系列动作(包括调用工具,其中一种是开放搜索工具)来完成任务。开放搜索工具是一种新型的网络搜索工具,其性能优于现有的专有工具。结合强大的开源推理LLM(如DeepSeek-R1),ODS在SimpleQA和FRAMES两个基准测试中几乎达到了现有最先进的基线水平,有时甚至超越了它们。例如,在FRAMES评估基准上,ODS将最近发布的GPT-4o Search Preview的最佳现有基线准确率提升了9.7%。ODS是一个通用框架,可以无缝增强任何LLM的搜索和推理能力,从而实现最先进的性能表现。例如,DeepSeek-R1原本在SimpleQA上的准确率为82.4%,在FRAMES上的准确率为30.1%,而通过ODS的增强后,分别提升至SimpleQA的88.3%和FRAMES的75.3%。
  • 图表
  • 解决问题
    论文试图解决开放域问答中开源模型与专有模型性能差距的问题,特别是如何通过增强搜索和推理能力来提升开源大语言模型的表现。这是一个重要的问题,因为目前专有模型(如GPT-4o Search Preview)在性能上仍然显著领先于开源模型。
  • 关键思路
    论文提出了一种名为Open Deep Search (ODS) 的框架,该框架通过将基础开源LLM与两个关键组件结合:Open Search Tool(一个高效的网络搜索工具)和Open Reasoning Agent(一个能够调用工具完成任务的推理代理)。这种方法的核心新意在于利用外部工具增强LLM的能力,而不是单纯依赖模型参数规模或微调策略,从而实现接近甚至超越现有专有模型的效果。
  • 其它亮点
    1. ODS在FRAMES基准测试中比GPT-4o Search Preview提高了9.7%的准确率,在SimpleQA上也表现出色;2. 论文展示了ODS是一个通用框架,可以与任何LLM集成,例如DeepSeek-R1;3. 实验设计严谨,使用了SimpleQA和FRAMES两个公开数据集进行评估;4. 论文提到代码和模型可能会开源,为社区提供了进一步研究的基础;5. 提出了未来可能的研究方向,例如优化搜索工具效率和改进多模态推理能力。
  • 相关研究
    近期相关研究包括:1. Perplexity AI的Sonar Reasoning Pro,专注于结合搜索和推理;2. OpenAI的GPT-4o Search Preview,提供先进的搜索增强功能;3. DeepSeek系列模型(如DeepSeek-R1),作为强大的开源基座模型;4. 其他类似工作如Meta的LlamaIndex和Google的Retrieval-Augmented Generation (RAG),都在探索结合检索和生成的方法。
许愿开讲
PDF
原文
点赞 收藏 评论 分享到Link

沙发等你来抢

去评论