Adapting Differentially Private Synthetic Data to Relational Databases

简介

现有的差分隐私（DP）合成数据生成机制通常假设只有一个数据源表。实际上，数据通常分布在跨越多个表的关系型数据库中。在本文中，我们介绍了一种前所未有的算法，可以与任何现有的DP机制结合使用，生成合成关系型数据库。我们的算法通过迭代地优化个别合成表之间的关系，以在维持引用完整性的同时最小化其低阶边缘分布的近似误差。最后，我们为我们的算法提供了DP和理论上的效用保证。
作者讲解

目前尚无作者解读视频，你可点击下方【许愿开讲】按钮，许愿作者开讲~
图表
解决问题

解决问题：论文试图解决什么问题，或者验证什么假设？这是否是一个新问题？
关键思路

关键思路：论文中解决问题的方案关键思路是什么？相比当前这个领域的研究状况，这篇论文的思路有什么新意？
其它亮点

其他亮点：论文提出了一种可以与任何现有的DP机制相结合生成合成关系数据库的算法。该算法通过迭代地优化各个合成表之间的关系，以最小化它们在低阶边缘分布方面的近似误差，同时保持引用完整性。论文还提供了DP和理论效用保证。
相关研究

相关研究：最近在这个领域中，还有哪些相关的研究被进行？能否列举一些相关研究的论文标题？