- 简介生成式人工智能技术的迅速发展引发了重大的版权问题,导致许多针对AI开发者的诉讼。虽然一些研究探讨了通过将生成模型的输出偏离那些类似于受版权保护的数据的方法来减轻版权风险,但很少有人关注这样一个问题:多少相似度是不可取的;更原创或独特的数据享有更强的保护,构成侵权的相似度门槛相应较低。在这里,利用这个原则,我们提出了一种通用化方法,修改生成模型的输出使其更通用,更不容易侵犯版权。为了实现这一目标,我们引入了一种度量数据原创性水平的度量标准,这种度量标准与法律框架一致。这个度量标准可以通过从生成模型中抽取样本来实际估计,然后用于通用化过程。实验表明,我们的通用化方法成功地修改了文本到图像生成模型的输出,使其产生更通用、符合版权的图像。
- 图表
- 解决问题如何通过减少生成模型输出的版权侵犯风险,解决人工智能技术的版权问题?
- 关键思路提出一种通用方法,通过量化数据的原创程度,并对生成模型输出进行修改,使其更加通用和符合版权法规。
- 其它亮点使用量化方法评估数据的原创性,并进行修改以达到版权合规的目的。实验结果表明,该方法成功地修改了文本到图像生成模型的输出,生成更加通用的图像。
- 最近的相关研究主要探索了通过调整生成模型输出来减少版权侵犯风险的方法。但是本论文提出的量化方法和通用化修改思路是新颖的。
沙发等你来抢
去评论
评论
沙发等你来抢