Adapting Differentially Private Synthetic Data to Relational Databases

2024年05月29日
  • 简介
    现有的差分隐私(DP)合成数据生成机制通常假设只有一个数据源表。实际上,数据通常分布在跨越多个表的关系型数据库中。在本文中,我们介绍了一种前所未有的算法,可以与任何现有的DP机制结合使用,生成合成关系型数据库。我们的算法通过迭代地优化个别合成表之间的关系,以在维持引用完整性的同时最小化其低阶边缘分布的近似误差。最后,我们为我们的算法提供了DP和理论上的效用保证。
  • 图表
  • 解决问题
    解决问题:论文试图解决什么问题,或者验证什么假设?这是否是一个新问题?
  • 关键思路
    关键思路:论文中解决问题的方案关键思路是什么?相比当前这个领域的研究状况,这篇论文的思路有什么新意?
  • 其它亮点
    其他亮点:论文提出了一种可以与任何现有的DP机制相结合生成合成关系数据库的算法。该算法通过迭代地优化各个合成表之间的关系,以最小化它们在低阶边缘分布方面的近似误差,同时保持引用完整性。论文还提供了DP和理论效用保证。
  • 相关研究
    相关研究:最近在这个领域中,还有哪些相关的研究被进行?能否列举一些相关研究的论文标题?
PDF
原文
点赞 收藏 评论 分享到Link

沙发等你来抢

去评论