本文提出了一种新的隐私保护合成数据生成算法,能够实现自动的主题分布匹配,适用于资源受限的AI应用。大规模差分隐私(DP)合成数据生成面临隐私、计算和效用之间的权衡,强隐私保障往往影响数据质量或需大量计算。现有方法通常依赖对大规模语言模型(LLM)进行私有微调,但计算成本高昂。近期的Aug-PE和Pre-Text算法虽仅需LLM API访问权限,但其效果有限。本文算法在保证隐私的同时,降低了计算需求,提高了实用性。
本专栏通过快照技术转载,仅保留核心内容
内容中包含的图片若涉及版权问题,请及时与我们联系删除
评论
沙发等你来抢