- 简介一些官方统计机构发布了合成数据作为公共使用的微观数据文件。实际上,对于每个分析,合成数据并不适用于准确的结果。因此,机构向用户提供有关其对合成数据分析质量的反馈是有益的。一种方法是将合成数据与验证服务器相结合,该服务器为用户提供使用合成数据和基础机密数据计算的估计值相似性的度量。然而,这些度量会泄露有关机密记录的信息,因此机构可能希望对发布的验证度量应用披露控制方法。我们提出了一种满足差分隐私的验证度量,并且可以在基础机密数据采用复杂调查设计的情况下使用。我们使用重复抽样模拟来说明验证度量,其中机密数据采用与大小成比例的概率设计进行抽样,分析师使用合成数据估计总体总数或平均数。模拟表明,验证度量可以提供有关合成数据推断质量的有用信息。
- 图表
- 解决问题验证合成数据的质量是一个重要的问题,但是现有的方法可能会泄露敏感信息,本文提出一种满足差分隐私的验证方法
- 关键思路本文提出的验证方法可以满足差分隐私,并且适用于复杂的调查设计
- 其它亮点本文使用重复抽样模拟来展示验证方法的可行性,并且结果表明该方法可以提供有用的信息来评估合成数据的推断质量
- 近期的相关研究包括利用合成数据进行隐私保护的方法,以及验证合成数据质量的其他方法,如基于模型的方法和基于比较的方法。
沙发等你来抢
去评论
评论
沙发等你来抢