- 简介在某些人工智能、机器学习和统计领域中,新方法和算法的验证常常受到适合的真实世界数据集的稀缺性的阻碍。研究人员经常不得不求助于模拟数据,这仅能提供有限的关于所提出方法在实际问题中适用性的信息。为了迈出一步,我们构建了两个设备,可以快速、廉价地从非平凡但被充分理解的物理系统中生成大量数据集。这些设备被称为因果实验室,是计算机控制的实验室,可以操作和测量这些物理系统的一系列变量,为各种领域的算法提供丰富的测试平台。我们通过一系列案例研究,如因果发现、分布外泛化、变点检测、独立成分分析和符号回归等领域,展示了潜在的应用。对于因果推断的应用,实验室允许我们仔细进行干预。我们还提供并经验证了每个实验室的因果模型,可以用作不同任务的基本事实。所有硬件和软件均为开源,数据集可通过causalchamber.org或Python包causalchamber公开获取。
- 图表
- 解决问题如何解决在一些领域中,由于缺乏真实世界数据集而无法验证新方法和算法的问题?
- 关键思路构建两个称为因果隔间的计算机控制实验室,可以快速、廉价地生成大型数据集,为算法提供丰富的测试平台。通过一系列案例研究展示了因果发现、分布外推、变点检测、独立分量分析和符号回归等领域的潜在应用。
- 其它亮点因果隔间提供了一种新的解决方案,可以快速、廉价地生成大型数据集,为算法提供丰富的测试平台。所有硬件和软件都是开源的,数据集可以通过 causalchamber.org 或 Python 包 causalchamber 免费获取。论文还提供并验证了每个因果隔间的因果模型,可以用作不同任务的基本事实。
- 最近的相关研究主要集中在因果推断、因果发现和独立分量分析等领域。
沙发等你来抢
去评论
评论
沙发等你来抢