今日,我们发布了《负责任扩展政策》(RSP)的重要更新,这是一项用于减轻前沿人工智能系统潜在灾难性风险的风险治理框架。此次更新引入了更灵活和细致的风险评估与管理方法,同时坚持不培训或部署未实施充分保障措施的模型。主要改进包括:新的能力阈值以确定何时升级保障措施、改进的模型能力和保障措施评估流程(借鉴安全案例方法)、以及加强内部治理和外部意见的新措施。通过从实施经验中学习,并借鉴其他高后果行业的风险管理实践,我们旨在更好地应对AI快速发展的挑战。随着前沿AI模型的进步,它们既带来了巨大的潜力,也带来了新的挑战。
本专栏通过快照技术转载,仅保留核心内容

内容中包含的图片若涉及版权问题,请及时与我们联系删除


评论
沙发等你来抢