在2017年的NeurIPS大会上,图灵奖得主,贝叶斯网络之父Judea Pearl提到当前机器学习系统不能作为强AI的基础,其突破口在于“因果革命”; 同年,国务院印发《新一代人工智能发展规划》,其中提到应用基础理论研究的一个重要方向就是"机器直觉推理与因果模型"; 至此越来越多的研究者(包括顶级AI学者Bengio,Feifei Li等)开始从因果推断的角度探索人工智能。在Judea Pearl的因果理论中,因果推理共包含三个基本任务:关联(Association),干预(Intervention)和反事实(Counterfactual),而这三个基本任务都需要使用因果结构(因果图)来做知识表达,由于基于传统随机对照试验的因果结构学习在很多场景涉及伦理道德及实验成本的问题,无法有效实施,基于观测数据的因果结构学习成为当前因果研究中一个基础且极具挑战的热点课题。
最近几年各类AI顶会上因果结构学习算法成果频出, 除了传统的基于约束和基于函数的因果结构学习算法,大量深度可微分(gradient-based)的结构学习算法也越来越受关注,如NOTEARS(NeurIPS 2018),DAG-GNN(ICML 2019),基于强化学习的因果学习算法(ICLR 2020)等等。虽然因果结构学习在学术上出现百花争鸣的态势,但离实际应用还存在较大差距,一个重要原因是工具包和Benchmark数据集(来源于真实场景)的匮乏:
-
其中工具包的匮乏使得很多商业公司没法基于自身场景快速创建因果结构学习任务,当前业界几个主流的因果结构学习工具包,如CMU Tetrad, BayesianLab, CausalImpact 等都仅包含少量传统因果结构学习算法(如PC,GES),且大都基于非纯python语言开发,一定程度限制了其应用和推广;
-
Benchmark数据集的缺失使得现有的大部分因果结构学习算法所做的因果假设都脱离实际场景,很难实现快速应用落地。
gCastle(A python library for Causal Structure Learning)是华为诺亚GTS大脑与因果基础研究团队联合自研的一个纯Python开发的因果结构学习工具包,其功能愿景是为业界提供一套完整的因果结构学习工具链及多个真实应用场景的因果数据集,以期弥补业界在因果发现工具链完整性和Benchmark数据集上的匮乏。gCastle共包含三个主要模块:因果发现算法库,数据生成模块及因果发现性能评测模块,其特性和亮点如下:
- 1. 完备的因果发现算法库
- 2. 丰富的数据处理算子和性能评测指标
- 3. 多个真实场景的因果数据集

本次开源发布为gCastle 0.0.1-beta版,开源地址为:https://github.com/huawei-noah/trustworthyAI/tree/master/gcastle (点击底部左下角“阅读原文”可直接进入)。本文接下来将对当前版本中具有代表性的几个自研算法进行简要介绍,感兴趣的可以继续戳原文。
内容中包含的图片若涉及版权问题,请及时与我们联系删除
评论
沙发等你来抢