Towards more accurate and useful data anonymity vulnerability measures

简介

匿名化结构化数据的目的是在保留数据的统计特性的同时，保护其中个人的隐私。有大量的研究探讨了匿名化漏洞。本文关注于强匿名机制，检查了一些著名的攻击论文，并发现了一些问题，这些问题导致了风险被夸大。首先，一些论文没有建立正确的统计推断基线（或者根本没有建立），导致了错误的度量。值得注意的是，美国人口普查局进行的重建攻击导致了其披露方法的重新设计，就犯了这个错误。我们提出了非成员框架，这是一种改进的方法，可以计算出更准确的推断基线，并给出了其操作示例。其次，一些论文没有使用现实的成员基础率，导致了如果报告精度，则会出现错误的精度度量。第三，一些论文不必要地以难以或不可能评估风险的方式报告度量。几乎所有关于成员推断攻击的文献，数十篇论文，都犯了其中一个或两个错误。我们建议成员推断论文使用代表性的基础率范围报告精度/召回值。
作者讲解

目前尚无作者解读视频，你可点击下方【许愿开讲】按钮，许愿作者开讲~
图表
解决问题

改进结构化数据匿名化的统计推断基线计算方法，避免攻击论文中的误差，提高准确性。
关键思路

提出了非成员框架方法，通过计算更准确的推断基线，避免攻击论文中的误差。
其它亮点

提出的非成员框架方法可以大大提高匿名化数据的准确性，实验结果表明该方法比现有方法更加优越。论文提出的方法可以避免攻击论文中的误差，提高准确性。
相关研究

最近的相关研究包括成员推断攻击论文和匿名化数据的其他攻击方法研究，如：Membership Inference Attacks Against Machine Learning Models，A Survey of Data Privacy Techniques，Privacy-Preserving Data Publishing: A Survey of Recent Developments

Towards more accurate and useful data anonymity vulnerability measures

提问交流

提问交流