清华大学朱军：发展安全可靠的AI，为什么依旧任重道远？

8 月 1 日，「青年科学家50²论坛」开幕，数十位院士与知名高校校长、百余名「科学探索奖」获得者与青年科学家在这一天齐聚深圳。

「科学探索奖」是目前国内金额最高的青年科技人才资助计划之一。自 2018 年设立起，「科学探索奖」已经评选出了共 100 位来自各领域的优秀青年科学家，每位均获得由腾讯基金会资助的 300 万元奖金，并且能够自由支配。2020 年第二届「科学探索奖」信息电子领域的获奖者之一、智源学者和清华大学教授朱军在会上发表了主题演讲。

在朱军看来，今天的人工智能远远算不上完美。首先是深度学习仍然面临着鲁棒性差的问题，比如很多手机都会配备人脸识别方案，但通过一副打印了特殊纹理图案的眼镜，就能轻松解锁很多手机；再说到安全需求更高的自动驾驶系统，黑客们只需要在标识牌上加上特定图案，就能让系统将限速标识识别为停止标识，导致致命事故的发生；就连 1750 亿参数的 GPT-3，虽然一贯被誉为全科优秀生，但答起题来也有驴唇不对马嘴的时候……

AI 为什么出错？如何防止 AI 出错？如果不能解决这些问题，那么 AI 就算不上是安全、可靠。

迄今为止，人类对深度神经网络等 AI 算法的出错机制知之甚少。一方面，数据的不确定性是广泛存在的，一旦遇到对抗样本攻击，哪怕是在一张图片中加上少量的噪音，虽然展示效果对人眼没有影响，但足以让人工神经网络产生误判。另一方面，数据中有用信息量的增长没跟上模型体量的增长，就会造成模型的不确定性。

朱军认为，这些问题都会造成「AI 不知道自己不知道」，而贝叶斯方法恰好能提供一种自然、严谨的不确定性计算方法。

贝叶斯与深度学习的结合

对于任何 AI 模型来说，无论开发过程如何，在现实世界中落地的过程一定是极具不确定性的。面对诸多未知，朱军认为用贝叶斯方法建模是一种解决方法。图灵奖得主、贝叶斯之父 Judea Pearl 是朱军一直以来最崇拜的学者之一，而朱军的工作则推动了贝叶斯方法的「深度」变革，将这一方法在人工智能领域的应用发扬光大。

深度学习本身属于机器学习的一端，它会用到大量的训练样本和计算资源，再加上网络结构的人为调整，在特定环境、特定数据集上得到非常高的准确度。另外一端则是贝叶斯的学习方法，贝叶斯程序可以用少量的训练样本学习非常精确的模型，在数据的利用上更高效，而且对抗鲁棒性好、可解释性强。

这种结合贝叶斯方法和深度学习各自优势的研究方向被称为贝叶斯深度学习（Bayesian Deep Learning /BDL），它包括传统的贝叶斯方法、以概率推断（probabilistic inference）为主的深度学习方法，以及二者的交叉，因此它既有贝叶斯本身的可解释性，可以从少量数据中学习，又有深度学习强大的拟合能力。

近年来，朱军重点关注对抗攻击鲁棒性以及不完全信息下的决策问题，在探索的过程中，仍有三个问题要解决：

如何融合二者的互补优点，发展统一的概率模型框架？
如何应对高度非线性变换，发展高效准确的推断算法？
如何自动 / 半自动地对模型进行可微分的概率编程？

从 2014 年起，机器学习界开始进行一些探索，朱军团队开发的「珠算」是最早的深度概率编程库之一。和现有的主要为监督式任务设计的深度学习库不同，珠算的特点是其在很大程度上根基于贝叶斯推理，因此支持各种生成模型：既包括传统的分层贝叶斯模型，也有最近的深度生成模型。

2017 年 5 月，朱军团队正式开源了「珠算」，研究者可以利用珠算强大的拟合能力和多 GPU 训练进行深度学习，同时可以用概率模型为复杂世界建模，开发无标注数据，根据贝叶斯推断的原则处理不确定性。「珠算」是首个与 TensorFlow 无缝衔接的概率编程库，全面支持 MindSpore、飞桨、Jittor、OneFlow 等国产平台。

目前，珠算已经支持变分和蒙特卡洛两大类的方法，包括了现在最主流的推理算法。珠算里也有很多已经实现的模型，比如像比较经典的 topic model、矩阵分解、贝叶斯高斯过程、卷积操作等等。新版本的珠算平台还加入了更多的模型实例，主题模型、概率矩阵分解；变分自编码器、贝叶斯神经网络、深度信念网络以及高斯过程。开发者和研究者们可以在珠算平台上使用已有的实现模型，并在此基础上开发新的模型。

朱军总结说，安全可靠的人工智能还需要从技术上进行突破，但也需要关注数据安全、系统安全。要想打造负责任的人工智能技术和应用，仍需群策群力和产学研用的深度合作。

内容中包含的图片若涉及版权问题，请及时与我们联系删除

清华大学朱军：发展安全可靠的AI，为什么依旧任重道远？

评论列表

评论