谷歌 | Learning to Generate Image Embeddings with User-level Differential Privacy（学习生成具有用户级差异隐私的图像嵌入）

作者：Zheng Xu, Maxwell Collins, Yuxiao Wang,等

简介：本文研究用于训练具有用户级差异隐私的嵌入模型。过去，基于设备的小型模型已经成功地使用用户级差分隐私（DP）进行了下一个单词预测和图像分类任务的训练。然而，当使用具有大型类空间的监督训练数据直接应用于学习嵌入模型时，现有方法可能会失败。为了实现大型图像到嵌入特征提取器的用户级DP，作者提出了DP FedEmb：一种具有每个用户灵敏度控制和噪声添加的联合学习算法的变体，用于从数据中心集中的用户分区数据进行训练。DP FedEmb结合了虚拟客户端、部分聚合、私有本地微调和公共预处理，以实现强大的隐私效用权衡。作者应用DP FedEmb来训练人脸、地标和自然物种的图像嵌入模型，并在基准数据集DigiFace、EMNIST、GLD和iNaturalist上展示其在相同隐私预算下的优越实用性。作者进一步说明：当数百万用户可以参加训练时，在将效用下降控制在5%以内的同时，有可能实现强大的用户级DP保证（ε<2）。

论文下载：https://arxiv.org/pdf/2211.10844.pdf

谷歌 | Learning to Generate Image Embeddings with User-level Differential Privacy（学习生成具有用户级差异隐私的图像嵌入）

评论