图片

🚌Paper Bus|阿里安全学术成果直通车:深入解读阿里安全在学术界的科研成果,持续追踪其在AI安全、网络安全、媒体安全等领域的技术先进性,让每一颗学术火种都能点燃创新裂变,为构建负责任的技术体系注入坚实动力。
本期为2025年12月—2026年3月阶段性学术成果集中展示,涵盖AI安全攻防、大模型安全对齐、网络基础设施安全、媒体内容安全等多个前沿领域。从国家级权威赛事荣誉,到顶级学术会议录用,阿里安全持续以硬核科研成果印证技术实力,推动安全研究从理论走向产业实践。

🔥成果1:阿里安全荣获第六届中国人工智能大赛AI安全方向三个赛道A奖

图片

内容简介:阿里安全在AI安全方向的3个赛道「AIGC音频检测」、「AIGC视频检测」、「AIGC标识提取、溯源案例」,均获得最高级别的A级证书。这已是阿里安全连续第二年在此项国家级赛事中斩获最高荣誉。


🔥成果2:阿里新开源提出建设性安全对齐方案,向“让用AI的人安全”新范式跃迁


内容简介:提出一种新型的大语言模型安全对齐范式——建设性安全对齐。该范式突破传统以拒绝为核心的防御式安全机制,转而构建一个动态、可优化、面向长期交互目标的博弈框架。在此框架中,AI不再“被动防御”用户,而是在确保安全的基础上,主动与用户协作,寻找安全且有价值的最佳回复策略。


🔥成果3:阿里安全的全球IP图谱入选第六届中国互联网基础资源大会IPv6典型案例

图片

内容简介:构建了多源融合的IPv6地理信息识别体系,通过机器学习动态加权融合与反馈纠错机制,叠加大模型驱动的智能纠错与知识抽取能力,实现从国家到区县的高精度地理定位。

🔥成果4:阿里安全与浙江大学联合提出的LLM越狱攻防新框架被安全顶会NDSS 2026录用

图片

内容简介:该框架打破了以往仅关注“攻击成功率”的单一维度,通过数据构建、因果图学习、实战应用三个层面的系统性创新,首次将模糊的越狱过程拆解为清晰的、人类可读的因果路径。
🔥成果5:阿里安全&华中科技大学最新研究成果被ICLR 2026录用

图片

内容简介:该方法实现ViT近乎无损的类特定压缩。通过“先训练再剪枝”的范式引导模型聚焦目标类别,引入结构化参数冗余,支持大模型近乎无损地转换为定制化小模型。


Paperbus合集
第一期
第二期


往期推荐

图片
AAIG课代表,获取最新动态就找她👇
图片

关注公众号发现更多干货❤️

图片
图片
图片

内容中包含的图片若涉及版权问题,请及时与我们联系删除