点击蓝字
关注我们
12月9日下午,清华大学与香港科技大学联合主办的2023人工智能合作与治理国际论坛的专题论坛“前沿大模型风险研判与治理”在香港科技大学盧家驄荟萃楼(Lecture Theater, Lo Ka Chung Building)成功召开。





周伯文在主旨发言中指出,通用人工智能的发展道路伴随着许多不确定性。亟需对其进行科学治理,以避免隐私、偏见、认知等多重风险与隐患。他尤其强调应针对被视为现代人工智能的基础设施的基础模型展开全生命周期治理。全球目前已在人工智能治理方面取得了显著进展,治理举措强调多利益相关者之间的共同合作。对此,他着重阐释了科学家在此之中扮演的关键角色。具体而言,科学家可以从横向与纵向两个方面参与人工智能全生命周期的治理,一是科学家在各利益相关者之间扮演协调与平衡者的角色,二是科学家需积极参与从数据到模型再到应用等各个环节的治理进程。而当前科学界对人工智能治理的研究仍较为零散,缺乏跨学科的整体视角。他建议科学家应引导人工智能的发展轨迹,更多地投入到可信人工智能的构建过程之中。最后,他强调各方应该通过协作努力、构建透明的框架以及制定坚定不移的承诺来塑造人工智能治理的未来。




吉米·巴(Jimmy Ba)以对GhatGPT 4等大规模语言模型的监管、治理和安全政策为切入点,提出人工智能的发展需要前瞻性(foresight)、洞察力(insight)以及监督性(oversight)。其中洞察力对人工智能的发展与治理尤为重要。他强调洞察力可以帮助了解人工智能需要什么样的监管,进而就人工智能治理展开更富有成效的讨论。而培养和提升针对人工智能技术的洞察力需要“两条腿”并行。一方面应提高普通民众的数字能力,利用人工智能拓展他们的专业知识。让人工智能技术赋能生产生活的同时,也可以帮助挖掘仍需改进的技术痛点。另一方面则是需要发挥专家在识别人工智能复杂问题方面的专业素养与洞察能力。此外,他还基于自身的教学经验,指出与其限制学生使用大模型,不如引导学生用辩证性的思维来评判大模型提供的答案与见解,这有助于培养学生理解什么是大模型,审视大模型存在什么问题,思考如何去改进大模型及可以提出何种治理政策建议。





迈克尔·塞利托(Michael Sellitto)介绍了Anthropic是如何开展负责任的技术创新工作的。他们通过负责任的扩展政策 (RSP) 定义了一个名为人工智能安全级别(ASL) 的框架,其基本思想是要求模型适应潜在灾难性风险的安全、保障和操作标准。而更高的 ASL 需要越来越严格的安全保障措施。ASL系统是通过“如果-那么”的逻辑和承诺关系开展工作的。如果模型显示出某些危险功能,那么它就需要符合下一个ASL级别的要求,并且需要新的安全、安全和部署措施。在训练期间定期运行评估,以便尽早确定何时达到更高的风险级别,他们会通过保守评估以搭建缓冲区。如果这些评估要求尚未到位,便会暂停进一步扩展和新的部署,直到达到要求目标。




肖恩·欧·海格缇(Sean S. ÓhÉigeartaigh)在主旨演讲中强调了大模型开源的重要性。他认为大模型开源需要做到两点,一是使模型架构和权重可供任何人免费修改、研究、构建和使用;二是人工智能开源程度的灵活性,它应该可以在不同程度上开源。他指出开源的好处毋庸置疑,它既可以促进创新和对前沿的不断探索,又可以通过开放人工智能访问使之更加民主化。然而开源也是具有风险的,如恶意应用程序、有针对性的宣传和错误信息、欺诈的可能性、危险信息、保障措施禁用、漏洞识别等。因此,对于许多基础模型来说,尽管好处大于风险,但尖端前沿模型可能不应该开源。需要通过围绕开源决策进行严格的风险评估、探索获得开源优势的替代途径、多方共同努力定义开源发布标准、政府对开源人工智能模型的监督等方式应对开源的新形势。
















高奇琦在致辞中提到了机器学习的可解释性和可扩展性、企业治理及人工智能开发等议题。他认为,关于人工智能治理方面,应该更注重于包容而不是排斥,通过各方利益相关者的合作促成国际共识;在企业治理方面,应设置首席风险官,延展内部审计过程的“红队判研”,确保相应比例的计算能力和人才用于调查在不同领域内的应用场景;而在人工智能开发方面,应用开源人工智能治理对社会道德的发展和人工智能对齐至关重要。






主旨发言结束后,尼古拉斯·米埃勒、·迈克尔·弗兰克、高奇琦、李婉诗以及清华大学战略与安全研究中心副主任陈琪、香港大学黄乾恒中国法研究中心主任张湖月进行了圆桌讨论。
讨论中,尼古拉斯·米埃勒指出,国际社会须为人工智能风险框架制定共同愿景,尤其是中美之间的合作对于应对人工智能风险至关重要。他建议,在人工智能风险管理方面,应用大语言模型建立预防机制。迈克尔·弗兰克提出,各方国际机构之间的合作必不可少,从小处着手,将人工智能安全与竞争问题脱钩,并将有关人工智能风险的学术讨论转化为政策机制。高奇琦认为,持续学习和人工智能对齐是人工智能治理领域的重点,但是,现今该领域缺乏各界专家的共识,应及时采取行动制定相关风险管理机制。李婉诗表示,人工智能监管的有效性和安全性是其治理的关键。在该问题上,我们不应拘束于单方体制,而应促进多方合作、制定国际通用原则。陈琪强调,应对人工智能技术的快速发展和其可能带来的潜在危险,需先明确定义通用人工智能。实现多边治理的重点在于与多方利益相关者创建共识和共同愿景。张湖月提出,地缘政治紧张局势的加剧损害了人工智能治理方面的国际合作。唯有驱动共识,才能解决人工智能风险的不可预测性。
关于我们
清华大学人工智能国际治理研究院(Institute for AI International Governance, Tsinghua University,THU I-AIIG)是2020年4月由清华大学成立的校级科研机构。依托清华大学在人工智能与国际治理方面的已有积累和跨学科优势,研究院面向人工智能国际治理重大理论问题及政策需求开展研究,致力于提升清华在该领域的全球学术影响力和政策引领作用,为中国积极参与人工智能国际治理提供智力支撑。
新浪微博:@清华大学人工智能国际治理研究院
微信视频号:THU-AIIG
Bilibili:清华大学AIIG
内容中包含的图片若涉及版权问题,请及时与我们联系删除
评论
沙发等你来抢