语言生成模型来了,学校的作业会不会从此变得形同虚设?近日,纽约市教育官员宣布禁止学生在公立学校使用 ChatGPT 的事件引发了争论 >>>纽约市教育局阻止学校设备和网络上使用ChatGPT
自动生成的内容会「参照」现有作品,产出的速度又几乎无限,人们对其的担忧已经蔓延到了 AI 学界自身,全球知名机器学习会议之一的 ICML 最近也宣布禁止发表包含由 ChatGPT 和其他类似系统生成内容的论文,以免出现「意外后果」。对于这样的情况,ChatGPT 的提出者 OpenAI 已宣布正在努力开发「缓解措施」,帮助人们检测由 AI 自动生成的文本。ICML投稿指南禁止论文包含大模型生成的文本引发热议
ChatGPT同团队的人开发了 GPT 检测器(https://huggingface.co/openai-detector)也已经有开发者制作了面向 ChatGPT 生成内容的检测工具——「GPTZero」,作者是普林斯顿大学的学生 Edward Tian。让我们看看检测过程,先以一段《New Yorker》的报道内容为例(百分之百确定由人类写作):
再看一段由 ChatGPT 生成的内容接受检测:
GPTZero 应用程序的原理是借助一些文本属性进行分析。首先是困惑度(perplexity),即文本对模型的随机性,或语言模型对文本的「喜爱」程度;然后是突发度(burstiness),即机器写作的文本在一段时间内表现出的困惑度更均匀和恒定,而人类书写的文本则不会这样。
GPTZero:「同学们,对不起!教授们,不客气!」
据《卫报》报道,OpenAI 目前正在开发一项功能,用于统计 ChatGPT 输出结果的「水印」,以便阅读器可以在 AI 文本选择中发现隐藏模式。
在得克萨斯大学的一次演讲中,OpenAI 客座研究员 Scott Aaronson 表示,公司正在研究一种通过「对输出进行统计水印」来打击作弊的系统。Aaronson 说,这项技术将通过微妙地调整 ChatGPT 选择的特定单词选择来发挥作用,读者不会注意到这种方式,但对于任何寻找机器生成文本迹象的人来说,这在统计上都是可预测的。
「我们实际上有一个水印方案的工作原型了,」Aaronson 补充道。「它似乎表现很好——根据经验,几百个词似乎足以得到一个信号:是的,这段文本来自 GPT。」
虽然面临人们的担忧,但有关 ChatGPT 的应用也在快速铺开。在很多场景中,人们不想与无法理解简单查询的聊天机器人对话,什么都可以说上两句的 ChatGPT 可以解决这一问题。总部位于多伦多的 Ada 已与 OpenAI 合作把 GPT-3.5,ChatGPT 背后的大模型应用在了客服聊天机器人上,完成了 45 亿次客户服务交互。
内容中包含的图片若涉及版权问题,请及时与我们联系删除
评论
沙发等你来抢