ResearStudio: A Human-Intervenable Framework for Building Controllable Deep-Research Agents

向作者提问

NEW

简介

当前的深度研究型智能体采用“发射后不管”的运行模式：一旦启动，用户便无法在执行过程中修正错误或添加专家知识。我们推出了ResearStudio，这是首个以实时人工控制为核心设计的开源框架。该系统遵循“协作工作坊”（Collaborative Workshop）架构：分层的规划-执行模块将每一步操作写入一个实时更新的“计划即文档”中，一个高速通信层则将每个动作、文件变更和工具调用实时推送到网页界面。在任何时刻，用户都可以暂停运行，修改计划或代码，执行自定义命令，然后继续运行——在AI主导、人类辅助，以及人类主导、AI辅助的模式之间无缝切换。在完全自主运行模式下，ResearStudio在GAIA基准测试中达到了业界领先水平，性能超越了OpenAI的DeepResearch和Manus等系统。这些结果表明，强大的自动化能力与细粒度的人工控制可以并存。全部代码、协议和评估脚本均已发布在 https://github.com/ResearAI/ResearStudio。我们将持续更新该代码仓库，以推动安全且可控的研究型智能体的进一步研究。我们的在线演示已公开，可通过 http://ai-researcher.net:3000/ 访问。我们同时支持DeepScientist的开发，其代码库位于 https://github.com/ResearAI/DeepScientist。
作者讲解·1
- 讲解视频(1)
- 相关报道
图表
解决问题

当前的深度研究代理大多采用'一次性触发后不管'（fire-and-forget）模式，用户在执行过程中无法干预、纠正错误或注入专家知识，导致缺乏实时可控性与协作性。论文试图解决如何在保持自动化性能的同时，实现人类对AI研究代理的细粒度、实时控制的问题。这是一个新兴且重要的问题，尤其在追求安全、可解释和可靠AI系统的背景下。
关键思路

ResearStudio提出了一种以实时人机协作为核心的新型框架，采用'协作工作坊'（Collaborative Workshop）设计，通过分层的Planner-Executor结构将每一步操作写入一个可编辑的'计划即文档'（plan-as-document），并利用高速通信层将所有动作、文件变更和工具调用实时同步到Web界面。用户可在任意时刻暂停、修改计划或代码、执行自定义命令并继续运行，实现AI主导、人机协同和人工主导之间的无缝切换。
其它亮点

在完全自主模式下，ResearStudio在GAIA基准测试中达到SOTA水平，超越OpenAI DeepResearch和Manus等系统，证明强自动化与高可控性可以共存。系统已完整开源（代码、协议、评估脚本）于GitHub：https://github.com/ResearAI/ResearStudio，并提供公开演示地址http://ai-researcher.net:3000/。支持DeepScientist项目发展。实验设计覆盖多轮复杂任务推理，验证了系统在动态修正、知识注入和模式切换方面的有效性，极具实用潜力。
相关研究

1. ‘AutoGPT: Autonomous Agent with Persistent Memory’ 2. ‘BabyAGI: Task-Driven Autonomous Agent’ 3. ‘MetaGPT: Meta Programming for Multi-Agent Collaborative Framework’ 4. ‘LangChain: Connecting LLMs to Applications’ 5. ‘Microsoft’s AutoGen: Enabling Next-Gen Large Language Model Applications’ 6. ‘Google’s GAIA: A Benchmark for Evaluating General AI Assistants in Realistic Tasks’

PDF

原文

点赞收藏

向作者提问

NEW

分享到Link

提问交流

提交问题，平台邀请作者，轻松获得权威解答～

向作者提问