OpenAI 正在自研ChatGPT检测审核工具

语言生成模型来了，学校的作业会不会从此变得形同虚设？近日，纽约市教育官员宣布禁止学生在公立学校使用 ChatGPT 的事件引发了争论 >>>纽约市教育局阻止学校设备和网络上使用ChatGPT

自动生成的内容会「参照」现有作品，产出的速度又几乎无限，人们对其的担忧已经蔓延到了 AI 学界自身，全球知名机器学习会议之一的 ICML 最近也宣布禁止发表包含由 ChatGPT 和其他类似系统生成内容的论文，以免出现「意外后果」。对于这样的情况，ChatGPT 的提出者 OpenAI 已宣布正在努力开发「缓解措施」，帮助人们检测由 AI 自动生成的文本。ICML投稿指南禁止论文包含大模型生成的文本引发热议

ChatGPT同团队的人开发了 GPT 检测器（https://huggingface.co/openai-detector）也已经有开发者制作了面向 ChatGPT 生成内容的检测工具——「GPTZero」，作者是普林斯顿大学的学生 Edward Tian。让我们看看检测过程，先以一段《New Yorker》的报道内容为例（百分之百确定由人类写作）：

再看一段由 ChatGPT 生成的内容接受检测：

GPTZero 应用程序的原理是借助一些文本属性进行分析。首先是困惑度（perplexity），即文本对模型的随机性，或语言模型对文本的「喜爱」程度；然后是突发度（burstiness），即机器写作的文本在一段时间内表现出的困惑度更均匀和恒定，而人类书写的文本则不会这样。

GPTZero：「同学们，对不起！教授们，不客气！」

据《卫报》报道，OpenAI 目前正在开发一项功能，用于统计 ChatGPT 输出结果的「水印」，以便阅读器可以在 AI 文本选择中发现隐藏模式。

在得克萨斯大学的一次演讲中，OpenAI 客座研究员 Scott Aaronson 表示，公司正在研究一种通过「对输出进行统计水印」来打击作弊的系统。Aaronson 说，这项技术将通过微妙地调整 ChatGPT 选择的特定单词选择来发挥作用，读者不会注意到这种方式，但对于任何寻找机器生成文本迹象的人来说，这在统计上都是可预测的。

「我们实际上有一个水印方案的工作原型了，」Aaronson 补充道。「它似乎表现很好——根据经验，几百个词似乎足以得到一个信号：是的，这段文本来自 GPT。」

虽然面临人们的担忧，但有关 ChatGPT 的应用也在快速铺开。在很多场景中，人们不想与无法理解简单查询的聊天机器人对话，什么都可以说上两句的 ChatGPT 可以解决这一问题。总部位于多伦多的 Ada 已与 OpenAI 合作把 GPT-3.5，ChatGPT 背后的大模型应用在了客服聊天机器人上，完成了 45 亿次客户服务交互。

内容中包含的图片若涉及版权问题，请及时与我们联系删除

OpenAI 正在自研ChatGPT检测审核工具

评论