- 简介水印算法已经在大型语言模型(LLM)中取得了高精度的检测LLM生成文本的能力。然而,现有方法主要集中在区分完全加水印的文本和未加水印的文本上,忽略了LLMs仅在大型文档中生成小节的实际情况。在这种情况下,平衡时间复杂度和检测性能带来了重大挑战。本文提出了WaterSeeker,一种新方法,可以在广泛的自然文本中高效地检测和定位带水印的段落。首先,它应用一种高效的异常提取方法来初步定位可疑的带水印区域。随后,它进行局部遍历并执行全文检测以进行更精确的验证。理论分析和实验结果表明,WaterSeeker在检测精度和计算效率之间实现了优越的平衡。此外,WaterSeeker的本地化能力支持开发可解释的AI检测系统。这项工作开创了水印段检测的新方向,促进了更可靠的AI生成内容识别。我们的代码可在https://github.com/THU-BPM/WaterSeeker上找到。
-
- 图表
- 解决问题解决问题:论文试图解决什么问题,或者验证什么假设?这是否是一个新问题?
- 关键思路关键思路:论文中解决问题的方案关键思路是什么?相比当前这个领域的研究状况,这篇论文的思路有什么新意?
- 其它亮点其他亮点:论文提出了WaterSeeker算法,旨在有效检测和定位大型语言模型生成的水印。算法首先使用高效的异常提取方法初步定位可疑的水印区域,然后进行局部遍历和全文检测以进行更精确的验证。实验结果表明,WaterSeeker在检测精度和计算效率之间实现了卓越的平衡。此外,WaterSeeker的本地化能力支持可解释的AI检测系统的发展。该论文的代码已经开源。
- 相关研究:最近在这个领域中,还有哪些相关的研究被进行?能否列举一些相关研究的论文标题?
NEW
提问交流
提交问题,平台邀请作者,轻松获得权威解答~
向作者提问

提问交流