- 简介当前的深度研究型智能体采用“发射后不管”的运行模式:一旦启动,用户便无法在执行过程中修正错误或添加专家知识。我们推出了ResearStudio,这是首个以实时人工控制为核心设计的开源框架。该系统遵循“协作工作坊”(Collaborative Workshop)架构:分层的规划-执行模块将每一步操作写入一个实时更新的“计划即文档”中,一个高速通信层则将每个动作、文件变更和工具调用实时推送到网页界面。在任何时刻,用户都可以暂停运行,修改计划或代码,执行自定义命令,然后继续运行——在AI主导、人类辅助,以及人类主导、AI辅助的模式之间无缝切换。在完全自主运行模式下,ResearStudio在GAIA基准测试中达到了业界领先水平,性能超越了OpenAI的DeepResearch和Manus等系统。这些结果表明,强大的自动化能力与细粒度的人工控制可以并存。全部代码、协议和评估脚本均已发布在 https://github.com/ResearAI/ResearStudio。我们将持续更新该代码仓库,以推动安全且可控的研究型智能体的进一步研究。我们的在线演示已公开,可通过 http://ai-researcher.net:3000/ 访问。我们同时支持DeepScientist的开发,其代码库位于 https://github.com/ResearAI/DeepScientist。
-
- 图表
- 解决问题当前的深度研究代理大多采用'一次性触发后不管'(fire-and-forget)模式,用户在执行过程中无法干预、纠正错误或注入专家知识,导致缺乏实时可控性与协作性。论文试图解决如何在保持自动化性能的同时,实现人类对AI研究代理的细粒度、实时控制的问题。这是一个新兴且重要的问题,尤其在追求安全、可解释和可靠AI系统的背景下。
- 关键思路ResearStudio提出了一种以实时人机协作为核心的新型框架,采用'协作工作坊'(Collaborative Workshop)设计,通过分层的Planner-Executor结构将每一步操作写入一个可编辑的'计划即文档'(plan-as-document),并利用高速通信层将所有动作、文件变更和工具调用实时同步到Web界面。用户可在任意时刻暂停、修改计划或代码、执行自定义命令并继续运行,实现AI主导、人机协同和人工主导之间的无缝切换。
- 其它亮点在完全自主模式下,ResearStudio在GAIA基准测试中达到SOTA水平,超越OpenAI DeepResearch和Manus等系统,证明强自动化与高可控性可以共存。系统已完整开源(代码、协议、评估脚本)于GitHub:https://github.com/ResearAI/ResearStudio,并提供公开演示地址http://ai-researcher.net:3000/。支持DeepScientist项目发展。实验设计覆盖多轮复杂任务推理,验证了系统在动态修正、知识注入和模式切换方面的有效性,极具实用潜力。
- 1. ‘AutoGPT: Autonomous Agent with Persistent Memory’ 2. ‘BabyAGI: Task-Driven Autonomous Agent’ 3. ‘MetaGPT: Meta Programming for Multi-Agent Collaborative Framework’ 4. ‘LangChain: Connecting LLMs to Applications’ 5. ‘Microsoft’s AutoGen: Enabling Next-Gen Large Language Model Applications’ 6. ‘Google’s GAIA: A Benchmark for Evaluating General AI Assistants in Realistic Tasks’
- 1
NEW
提问交流
提交问题,平台邀请作者,轻松获得权威解答~
向作者提问

提问交流