Deep Researcher with Test-Time Diffusion

2025年07月21日
  • 简介
    借助大语言模型(LLMs)驱动的深度研究代理正在快速发展;然而,在使用通用的测试时扩展算法生成复杂、长篇的研究报告时,其表现往往趋于瓶颈。受人类研究迭代本质的启发——这一过程包括搜索、推理与修订的循环——我们提出了测试时扩散深度研究者(TTD-DR)。这一新框架将研究报告的生成概念化为一个扩散过程。TTD-DR从一个初步草稿开始这一过程,该草稿是一个可更新的框架,作为不断演进的基础,用以引导研究方向。随后,该草稿通过一个“去噪”过程进行迭代优化,这一过程由一个检索机制动态支持,在每一步中引入外部信息。该核心过程进一步通过应用于代理工作流各个组件的自进化算法得到增强,确保为扩散过程生成高质量的上下文。这种以草稿为中心的设计使报告撰写过程更加及时、连贯,同时减少了迭代搜索过程中的信息丢失。我们证明,TTD-DR在需要密集搜索和多跳推理的多种基准测试中达到了最先进的水平,显著优于现有的深度研究代理。
  • 图表
  • 解决问题
    论文旨在解决当前基于大型语言模型(LLMs)的深度研究代理在生成复杂、长篇研究报告时表现受限的问题。现有方法在测试时使用通用的扩展算法,往往难以维持内容的连贯性与信息的完整性,导致性能趋于饱和。这个问题在自动化研究生成领域是一个相对较新的挑战。
  • 关键思路
    论文提出了一种受人类研究过程启发的新框架——Test-Time Diffusion Deep Researcher(TTD-DR)。该方法将研究报告生成建模为一个扩散过程,从一个初步草稿(可更新的骨架)出发,通过动态检索外部信息并进行“去噪”迭代优化,逐步完善报告内容。其核心创新在于将扩散模型的思想引入研究代理的推理流程,并结合自演化算法提升各组件性能。
  • 其它亮点
    {TTD-DR采用草稿驱动的设计,使得报告生成过程更及时、连贯,并减少信息丢失。,引入自演化算法提升代理各模块的能力,增强了生成内容的质量。,实验表明,TTD-DR在需要密集搜索和多跳推理的多个基准任务上显著优于现有研究代理。,实验设计覆盖广泛,验证了方法在复杂推理任务上的有效性。,未来值得研究的方向包括:将该框架应用于真实世界的研究辅助系统、进一步优化检索与生成的协同机制。}
  • 相关研究
    {"Self-Refine: Iterative Refinement with Self-Feedback","Chain-of-Thought Prompting Elicits Reasoning in Large Language Models","Active Retrieval Augmented Generation","Reasoning with Language Models through Sequential Simulation","Agent-based Reasoning with Modular Memory and Planning"}
PDF
原文
点赞 收藏 评论 分享到Link

沙发等你来抢

去评论