今天给大家介绍的是来自美国东北大学Jennifer Dy教授团队和哈佛大学Edwin K. Silverman教授团队联合发表在ICLR 2022上的文章"Explanations of Black-Box Models based on Directional Feature Interactions"。模型的可解释性是大多数机器学习系统需要的一种能力。最近的几项工作通过捕获每个输入实例中最具影响力的特征来解释黑盒模型,这种解释方法是单变量的,因为它们只描述单个特征的重要性。本文将单变量解释扩展到更高阶,通过双变量方法捕获黑盒模型中的不对称特征交互,并将其表示为有向图,从而进一步提高模型的可解释性。实验表明,本文提出的基于双变量的不对称特征交互方法优于现有的可解释性代表性方法。

论文地址:https://openreview.net/pdf?id=45Mr7LeKR9

内容中包含的图片若涉及版权问题,请及时与我们联系删除