本期热点讨论

💙 AGI在安全伦理方面面临哪些主要风险？

💙 通用大模型可能面临哪些攻击模式？

💙 如何评估通用大模型在实际应用中的安全性和伦理性？

本周三(1月10日)19:00，《追AI的人》系列直播第34期邀请了复旦大学计算机科学与技术学院张谧教授分享。

直播详情

直播主题：《当“巨兽”成为“宠物”：复旦白泽带你领略大模型安全伦理风险与治理》

直播时间：2024年1月10日(周三)19:00

直播地点：微信搜索“阿里巴巴AI治理中心”视频号，B站搜“AAIG课代表”。

议题简介

以ChatGPT为代表的生成式AI已成为人工智能和相关垂直领域的重大变革力量。本报告以近期OpenAI内部风波和作为舆论焦点的Q*模型为切入点，介绍通用人工智能（AGI）面临的安全伦理风险。作为当前AGI技术发展的基石，以ChatGPT为代表的通用大模型生成内容安全至关重要。

本报告第二部分将剖析通用大模型面临的多种攻击模式。最后，在生成式AI安全风险全球治理的政策背景下，梳理大模型安全治理技术发展脉络，分享复旦白泽大模型靶向式安全评测平台JADE对大模型健康发展的助力作用。

💛【课程大纲】：

1、通用人工智能安全前沿

2、通用大模型安全风险

3、通用大模型安全治理

4、总结与展望

讲师简介

张谧

复旦大学计算机科学与技术学院教授、博导，系统软件与安全实验室-白泽智能负责人。研究领域为AI安全，包括模型安全、数据安全、生成式AI安全等，成果发表于网络安全与AI领域顶会顶刊，包括S&P、USENIX Security、CCS、TDSC和TPAMI、ICML、NeurIPS、ICDE、KDD、SIGIR、AAAI等，曾获网安顶会ACM CCS最佳论文提名奖。

担任领域顶会Organization Commitee成员以及顶会顶刊程序委员。主持科技部重点研发计划课题等多项国家级和省部级课题，并与阿里、华为、百度等建立企业项目合作，形成成果落地，获CCF科学技术奖自然科学二等奖、华为优秀技术成果奖、CNVD国家最具价值漏洞等荣誉。深度参与信安标委《生成式人工智能服务安全基本要求》、《人工智能安全标准化白皮书》等多项国家/行业标准编制/建议工作。

追AI的人是什么？

《追AI的人》系列直播是一档由阿里巴巴人工智能治理与可持续发展研究中心(AAIG)联合高校和产业界发起的AI治理交互栏目。重点关注并分享人工智能新技术、AI治理新观点、可持续发展新风向。目前联合高校、律所等多家单位举办了33期直播，吸引全国超100万人次实时观看。