有网文作者发现,有人利用Open AI的GPT-3,一直在偷偷摸摸地抓取AO3的素材,获取巨额利润!

 

写过网文的筒子们都知道,文字可是按字数明码标价的。为了完成几千字的日更数,写手们可是绞尽脑汁,很多时候不得不注水,宁可让自己的大作烂尾,几千章了都不完结。

 

而GPT-3、ChatGPT之类的大型语言模型,简直就是个巨无霸码字机,日产几十万字不在话下。

 

最可怕的是,网上有海量的数据集可以给它们去训练,数据一喂,AI们秒变文豪,各种文风不在话下,这还有人类写手的活路吗?

 

图片

 

最近,已经有AO3的写手怀疑,有人用AI抓取AO3上的数据集,然后用来谋利,他已经向AO3和OTW发出了检举信,请组织站出来捍卫人类写手的权利。

 

看了太多AO3,GPT-3秒变ABO「带文豪」

众所周知,GPT-3这种超大型语言模型的创作实力,是相当惊艳的。

 

经过大量互联网数据训练出的模型,处理语言的技巧如此之高,能力如此之完善,输出如此之新颖而独创,闪烁着人类想象力的光辉。

 

国外的一位作家James Yu被这些语言模型的能力所震惊了:「这些语言模型在文本理解方面的表现几乎与人类一样好,太惊人了。」

 

图片

 

受此启发,他创建了一款基于GPT-3的写作小程序Sudowrite。

 

在这款小程序中,只要输入一段文字,就可以自动生成下一段的内容。而且整段文字的风格都很统一,会被人认为是同一个作者所写的。

 

而一位同人圈大大发现,Sudowrites很可能是从AO3上抓取的数据集。

 

比如,输入这句话「Steve had to admit that he had some reservations ABOut how the New Century handled the social balance between alphas and omegas」(史蒂夫不得不承认,他对新世纪如何处理Alpha和Omega之间的社会平衡持保留意见)。

 

图片

作为一名Omega,他知道在这个高度竞争的社会中立足,不论是与Alpha竞争还是与Omega做朋友,都非常不易。

 

对于Steve这样渴望出人头地,希望成为职场高管的人来说,更是如此。

他清楚,他和好朋友兼室友Tony的关系并不平等。

 

这位网友又试了一下,输入的语句中包括Jeongguk murmurs(Jeongguk低声说着), nuzzling into Jimin's neck(用鼻子蹭着 Jimin 的脖子), scenting him(闻着他的味道)等词汇,这次,生成的结果中,包含了非常NSFW的内容,包括knotting(结), bite marks(咬痕),以及更不可描述的内容。

 

最后,这位网友想测试一下,Sudowrites是否可以通过自己的提示生成器,生成一篇真正的同人文。

 

Sudowrites有一个名为「改写」和「描述」的功能,它可以不断扩展现有的句子,一直循环,直到它生成你想命中的东西。对此,创作者自豪地称之为AI为你所做的「头脑风暴」。

 

输入「他睁开眼睛」这一段,右侧,是AI经过若干次头脑风暴后生成的同人文——

 

图片

他的声音友好而粗粝。「你是哈利波特,你的名字就写在你身上。你什么都不记得了,是吗?」

 

哈利波特认为这不是个反问句,所以回答了:「是的。」

 

男人皱起眉头,将双手交叠放在膝上。「当你在杀戮咒面前倒下时,你就失去了记忆。病历上是这么说的。」

 

笑死……所以同人文的尽头是哈利波特?

 

总之,这位作者已经向AO3和OTW发了举报信,检举AI在用他们的作品来训练数据集。

你好,

 

我是AO3几个同人圈的作家,日常从事软件方面的工作。

 

最近我发现,GPT-3等几个主要的自然语言处理 (NLP) 项目一直在使用Common Crawl和其他网络服务等服务来增强他们的NLP数据集,我担心AO3的作品可能会在没有作者的情况下被抓取和挖掘。

 

这涉及到许多营利性人工智能写作程序,如Sudowrites、WriteSonic和其他使用GPT-3的程序。这些 AI应用程序将我们创作的作品用于娱乐,它们不仅获得了利润,而且有一天可能会取代人类写作。(尤其是Sudowrites)

 

我希望AO3可以表明立场,并保护作者的权利,因此让我们的文章不能也永远不会用于GPT-3和其他类似的AI上。

内容中包含的图片若涉及版权问题,请及时与我们联系删除