HyperAgents：AI首次改进"改进自己的方式"

现有的自改进框架通常依赖于固定的、手工设计的元级机制，从根本上限制了系统的改进速率。虽然DGM通过将自我修改转化为编程任务，实现了自改进能力的递归增长，但这种能力提升与任务表现之间的对齐关系在编程之外的领域并不普适。

为突破这一瓶颈，Meta团队及其合作者提出了自我参照智能体框架HyperAgents，进一步构建的DGM-H系统在四大跨领域任务中均实现性能提升，为开放式、跨域迁移的自改进AI提供了全新范式。

[让我看看]DGM-H：跨域元级能力改进

DGM-H 系统的运作包含两个交替阶段：

1️⃣元认知自我修正：将任务智能体与元智能体统一到一个可编辑程序中，连原本固定的元级改进机制也变成了可被优化的对象，从而实现真正的自我参照式改进。
2️⃣实证评估：对修改后的新智能体变体进行实际测试，随后将其重新添加到存档档案中，进一步地，DGM-H表现出元层改进的跨领域迁移与累积能力。

此外，DGM-H在迭代过程中，还自主涌现出了没有提前预设的元级能力。这些元级的改进，天然具备跨领域迁移、跨运行累积的特性。

[加油]实验结果

研究团队在多组实验上证实了DGM-H的通用自我进化能力。

1️⃣任务层面：DGM-H 在论文审阅测试集上从0提升至0.71，机器人奖励设计从0.06提升至0.372，在编程与多语言编程上，将其性能分别从20.0%提升至50.0%，从14.2%提升至30.7%；

2️⃣元能力层面：在各任务中完成优化的Hyperagents，迁移至完全未接触过的奥林匹克数学评分领域后，imp@50指标达到0.63，而手工设计DGM的迁移智能体该指标近乎为0；

3️⃣自我改进能力：迁移智能体启动的DGM-H在奥数评分上取得更高最终性能，证明其自我改进能力可跨领域、跨运行持续叠加。

通过定性分析，DGM-H自主发展出性能追踪、持久记忆、偏差检测、计算感知策略规划等元能力，使其能快速自我优化。

[鼓掌]局限与未来工作

当然，DGM-H也面临着局限与面临的安全挑战。

当前DGM-H在预定义任务上运行，无法自主生成和演化课程，开放式探索循环的部分组件（如父代选择、评估协议）仍保持不可修改这可能限制了真正无限的开放式进步。

研究团队表示，本次所有实验，均在严格设计的环境中运行，配合全流程的资源限制与人工监督。随着系统能力增强，如何在透明度、可控性与系统潜力之间取得平衡，是开放式自我改进系统需面对的核心挑战。

更多细节，请查看原论文。
整理：珏子

#大模型 #人工智能 #AI #自我进化 #Meta

内容中包含的图片若涉及版权问题，请及时与我们联系删除

HyperAgents：AI首次改进"改进自己的方式"

评论列表

评论