SkillOpt: Agent skills as trainable parameters

SkillOpt革新AI代理技能优化方式，将手工修改技能指令转变为可控训练过程，无需更新模型权重。它将技能文件视为冻结大模型外的可训练参数，通过有界文本编辑、验证门控、拒绝编辑反馈及慢速/元更新等机制，确保技能简洁、可审计且避免提示漂移。在6个基准、7个目标模型和3种执行模式共52项评估中，SkillOpt均位列最佳或并列最佳，显著提升代理可靠性。其优化后的技能具备跨模型规模、代理框架及关联任务的强迁移能力，表明所学为通用工作流知识而非过拟合的基准特化指令。

本专栏通过快照技术转载，仅保留核心内容