- 简介我们提出了PPCEF,一种生成概率合理的反事实解释(CFs)的新方法。PPCEF通过将利用数据分布的概率公式与在统一框架内优化合理性相结合,进一步发展了现有方法。与参考方法相比,我们的方法通过直接优化显式密度函数来强制实现可信度,而不是假定特定的参数化分布族。这确保CFs不仅有效(即实现类别更改),而且与基础数据的概率密度相符。为此,我们的方法利用正则流作为强大的密度估计器,以捕获复杂的高维数据分布。此外,我们引入了一种新的损失函数,平衡实现类别更改和保持接近原始实例之间的权衡,同时还包含概率合理性项。 PPCEF的无约束公式允许使用批处理进行有效的基于梯度的优化,与先前方法相比,计算速度提高了数个数量级。此外,PPCEF的无约束公式允许无缝集成针对特定反事实属性的未来约束。最后,广泛的评估证明了PPCEF在生成高质量的概率合理的高维表格设置的反事实解释方面的优越性。这使PPCEF不仅成为解释复杂机器学习模型的强大工具,而且为提高AI系统的公平性,责任性和信任性提供了帮助。
- 图表
- 解决问题本论文旨在提出一种新方法PPCEF,用于生成概率上可信的反事实解释(CFs),并解决现有方法中存在的问题。
- 关键思路该方法采用概率公式和可信度优化相结合的方法,通过直接优化显式密度函数来保证CFs不仅有效(即实现类别变化),而且与潜在数据的概率密度一致。该方法使用正常流作为强大的密度估计器来捕捉复杂的高维数据分布,并引入一种新的损失函数来平衡实现类别变化和保持接近原实例的权衡,同时还包括概率上的可信度项。
- 其它亮点该方法的无约束公式允许有效的基于梯度的优化,与批处理相结合,计算速度比之前的方法快几个数量级。此外,PPCEF的无约束公式允许无缝地集成未来的约束,以适应特定的反事实属性。实验结果表明,PPCEF在生成高质量、概率上可信的高维表格反事实解释方面具有优势,这使得PPCEF不仅是解释复杂机器学习模型的强大工具,而且是提高AI系统公平性、可信度和可靠性的强有力手段。
- 在这个领域中,最近的相关研究包括:《Counterfactual Explanations without Opening the Black Box: Automated Decisions and the GDPR》、《Counterfactual Fairness》、《Explanations based on the Missing: Towards Contrastive Explanations with Pertinent Negatives》等。
沙发等你来抢
去评论
评论
沙发等你来抢