Keep It Private: Unsupervised Privatization of Online Text

简介

作者模糊技术有望通过自动重写文本来隐藏原始作者的身份，从而帮助人们保护在线通信的隐私。然而，在自然语言处理的研究中，作者模糊技术在狭窄的设置中进行了评估，并且主要通过肤浅的编辑操作来解决，这可能导致不自然的输出。在本研究中，我们引入了一种自动文本私有化框架，通过强化学习对大型语言模型进行微调，以产生平衡准确性、意义和隐私的重写。我们在由68k个作者组成的大规模英文Reddit帖子的测试集上进行了广泛评估，这些帖子由短到中等长度的文本组成。我们研究了在作者个人资料长度和作者身份检测策略等评估条件下性能的变化。我们的方法通过自动化指标和人类评估保持高文本质量，并成功地避开了几种自动化作者身份攻击。
作者讲解

目前尚无作者解读视频，你可点击下方【许愿开讲】按钮，许愿作者开讲~
图表
解决问题

论文旨在解决在线通信中隐私保护的问题，通过自动重写文本来隐藏原始作者的身份。
关键思路

论文提出了一种通过强化学习对大型语言模型进行微调的自动文本私有化框架，以产生平衡准确性、意义和隐私的重写文本。
其它亮点

论文在大规模的Reddit英文帖子上进行了广泛的评估，维护了高水平的文本质量，并成功逃避了多种自动化作者攻击。
相关研究

最近的相关研究包括：1. "Obfuscating Text to Preserve Privacy: A Survey"；2. "Privacy-Preserving Textual Analysis: A Survey of Recent Approaches"；3. "Privacy-Preserving Text Classification: A Review of Recent Literature"

Keep It Private: Unsupervised Privatization of Online Text

提问交流

提问交流