Safety Cases: How to Justify the Safety of Advanced AI Systems

简介

随着人工智能系统变得更加先进，公司和监管机构将不得不做出艰难的决定，即是否安全地训练和部署它们。为了准备这些决定，我们研究了开发者如何制定“安全案例”，即一种结构化的理由，证明人工智能系统不太可能引发灾难。我们提出了一个组织安全案例的框架，并讨论了四类证明安全的论点：完全无法引发灾难、足够强的控制措施、尽管具有危害能力但值得信赖、以及——如果人工智能系统变得更加强大——应听取可信的人工智能顾问的意见。我们评估了每个类别中具体的论点示例，并概述了如何将这些论点组合起来证明人工智能系统可以安全地部署。
作者讲解

目前尚无作者解读视频，你可点击下方【许愿开讲】按钮，许愿作者开讲~
图表
解决问题

如何制定人工智能系统的安全证明？
关键思路

提出了一个安全证明的框架，包括四种证明方式：无法造成灾难、强大的控制措施、可信性和权威建议。
其它亮点

论文提供了具体的证明方式并且给出了案例，同时讨论了如何将这些证明方式结合起来。
相关研究

与该论文相关的研究包括《AI安全证明的挑战和机遇》、《人工智能安全：现状和未来方向》等。