🚀华为openPangu-DeepDiver开源,深度研究多Agent系统,支持百步以上工具推理,万字报告快速生成
🤖采用Planner+Executors协同架构+文件系统通信,专攻复杂信息检索与长文调研报告生成。\x0a\x0a📊 在主流DeepResearch Agent榜单上成绩亮眼:\x0a1. BrowseComp-zh:38B模型达到34.6分,超越WebSailor-72B(30.1)\x0a2. BrowseComp-en:13.4分,同规模开源模型中最高\x0a3. 长文生成:总体水平第一梯队,平均报告24.6K tokens(是 o3 DeepResearch 的 2×+),在信息丰富度、事实性和多样性上都表现亮眼。\x0a\x0a🛠️ 训练范式:冷启动SFT → 迭代式RFT\x0a- 轨迹级正确性过滤+步骤级打分过滤;\x0a- Planner-centric 的Credit Assignemnt,将Planner评分传递 Executors;\x0a- 完全依托依托1000+Ascend NPU集群(8 NPU/节点,HCCS + RoCE 200Gbps),配合Agent Factory与StaleSync提升训练效率,在线RFT用dynamic batching+partial rollout稳定长轨迹优化。\x0a\x0a🔍 有趣发现:\x0a- 性能瓶颈在Executors而非Planner;\x0a- Planner “够用就好”,升级Executors带来更大收益;\x0a- 经协作训练的子智能体单独使用时同样强大:38B的Information Seeker单独测试BrowseComp-zh就能跑赢WebSailor。\x0a\x0a[机智]尝试了几个问题。比如深度调研一下中国蓝牙耳机细分市场。\x0a\x0aDeepDiver-V2给出了详尽的长文调研:从品类分析、竞争格局,到消费者洞察以及技术的发展,都讲得条理清晰、细节丰富。\x0a\x0a[哇]DeepDiver-V2 已开源,感兴趣的伙伴可以使用开源代码仓体验。\x0a🔗 模型:https://ai.gitcode.com/ascend-tribe/openPangu-Embedded-7B-DeepDiver\x0a📄 报告:https://ai.gitcode.com/ascend-tribe/openPangu-Embedded-7B-DeepDiver/blob/main/docs/openpangu-deepdiver-v2-tech-report.pdf
内容中包含的图片若涉及版权问题,请及时与我们联系删除


评论
沙发等你来抢