
💙 如何评估通用大模型在实际应用中的安全性和伦理性?
本周三(1月10日)19:00,《追AI的人》系列直播第34期邀请了复旦大学计算机科学与技术学院张谧教授分享。
直播主题:《当“巨兽”成为“宠物”:复旦白泽带你领略大模型安全伦理风险与治理》
直播地点:微信搜索“阿里巴巴AI治理中心”视频号,B站搜“AAIG课代表”。以ChatGPT为代表的生成式AI已成为人工智能和相关垂直领域的重大变革力量。本报告以近期OpenAI内部风波和作为舆论焦点的Q*模型为切入点,介绍通用人工智能(AGI)面临的安全伦理风险。作为当前AGI技术发展的基石,以ChatGPT为代表的通用大模型生成内容安全至关重要。
本报告第二部分将剖析通用大模型面临的多种攻击模式。最后,在生成式AI安全风险全球治理的政策背景下,梳理大模型安全治理技术发展脉络,分享复旦白泽大模型靶向式安全评测平台JADE对大模型健康发展的助力作用。
复旦大学计算机科学与技术学院教授、博导,系统软件与安全实验室-白泽智能负责人。研究领域为AI安全,包括模型安全、数据安全、生成式AI安全等,成果发表于网络安全与AI领域顶会顶刊,包括S&P、USENIX Security、CCS、TDSC和TPAMI、ICML、NeurIPS、ICDE、KDD、SIGIR、AAAI等,曾获网安顶会ACM CCS最佳论文提名奖。担任领域顶会Organization Commitee成员以及顶会顶刊程序委员。主持科技部重点研发计划课题等多项国家级和省部级课题,并与阿里、华为、百度等建立企业项目合作,形成成果落地,获CCF科学技术奖自然科学二等奖、华为优秀技术成果奖、CNVD国家最具价值漏洞等荣誉。深度参与信安标委《生成式人工智能服务安全基本要求》、《人工智能安全标准化白皮书》等多项国家/行业标准编制/建议工作。《追AI的人》系列直播是一档由阿里巴巴人工智能治理与可持续发展研究中心(AAIG)联合高校和产业界发起的AI治理交互栏目。重点关注并分享人工智能新技术、AI治理新观点、可持续发展新风向。目前联合高校、律所等多家单位举办了33期直播,吸引全国超100万人次实时观看。
内容中包含的图片若涉及版权问题,请及时与我们联系删除
评论
沙发等你来抢