2024年1月26日下午,由中国政法大学数据法治研究院主办的“生成式人工智能知识产权与法律治理”专题研讨会在北京国二招宾馆举行,来自全国各地的法律学者、技术专家、学术编审、实务代表等三十余人参加了会议。
会议由中国政法大学数据法治研究院张凌寒教授主持,研讨会分为“人工智能生成物的知识产权保护”“训练数据的利用与保护”两个单元进行。
第一单元
人工智能生成物的知识产权保护
在引导发言环节,清华大学计算机系助理教授艾清遥对大模型相关的基础技术进行介绍。他指出,语言模型本质上是用神经网络模型描述语言背后所表示的语义,通过理解语义来完成对应的语言任务。
目前生成式大语言模型可归纳为数据、算法、应用三个核心部分。首先,数据是指人类原始积累的文本,这是构建大模型的基石。其次,基于数据可以构建不同的训练大模型的算法。通过不断地将数据以算法训练的方式“喂”给大模型后,大模型就拥有了一定的语言能力。最后,大模型因为能够构建语言背后的语义,其可根据用户需求引申推断出接下来说的话。他还介绍了司法大模型的评价体系,其指出司法大模型能力可划分为记忆、理解、推理、判别、生成以及伦理六个方面,根据不同能力对司法任务进行划分,继而评价大模型在司法任务上的具体表现。
北京互联网法院综合审判一庭副庭长朱阁对“AI文生图”著作权案审理思路进行介绍。关于作品认定,原告对人物呈现方式的设计、提示词的选择和顺序安排、参数设置、图片选定等都体现了原告的智力投入,故涉案图片具备“智力成果”要件。从涉案图片本身来看,体现出了与在先作品存在可以识别的差异性。从涉案图片生成过程来看,原告对于人物及其呈现方式等画面元素通过提示词进行了设计,对于画面布局构图等通过参数进行了设置,体现了原告的选择和安排。另一方面,原告通过输入提示词、设置相关参数,获得了第一张图片后,其继续增加提示词、修改参数,不断调整修正,最终获得涉案图片,这一调整修正过程亦体现了原告的审美选择和个性判断。在无相反证据的情况下,可以认定涉案图片由原告独立完成,体现出了原告的个性化表达,故涉案图片具备“独创性”要件。
关于作品类型,涉案图片是以线条、色彩构成的有审美意义的平面造型艺术作品,属于美术作品,受到著作权法的保护。关于权利归属,原告是直接根据需要对涉案人工智能模型进行相关设置,并最终选定涉案图片的人,涉案图片是基于原告的智力投入直接产生,且体现出了原告的个性化表达,故原告是涉案图片的作者,享有涉案图片的著作权。此外,本案也有一些利益衡量上的判断,一般会先考虑案件双方当事人之间的利益、考虑双方所在群体的利益、接下来会考量立法者立法时的价值选择、最后考量社会公共利益等。
在主旨发言环节,华东政法大学王迁教授提出,人工智能生成内容是否为作品首先要明确什么是著作权法上的创作。《著作权法实施条例》第3条明确规定,著作权法所称创作,是指直接产生文学、艺术和科学作品的智力活动。“直接产生”是人基于自由意志直接决定构成作品的表达性要素。人可以使用创作工具,但创作工具不会参与对表达性要素的决策过程。把生成式人工智能比喻为照相机是完全不能成立的。
关于思想与表达的区分,他指出,“智力投入”既可对应思想,也可对应表达,脱离“思想表达二分法”谈“智力投入”并无意义。同一个创作思想才能产生截然不同的许多表达。因此在不同人工智能系统中能导致不同内容生成的同一套提示词,相对于这些内容只能是思想。关于委托作品与人工智能生成内容的关系,他提出,根据接受创作要求者是否具有自由意志来判断提出创作要求的行为能否被认定为对作品的创作,是不符合法律逻辑的。
清华大学法学院崔国斌教授从开发者贡献和使用者贡献两个角度阐述AI协助创作作品的独创性问题。从开发者贡献角度,其指出是否保护AI开发者贡献更多是公共政策的问题,无需做复杂教义学讨论,就能得出答案。目前,开发者保持对AI系统的控制就能获得激励,廉价的AI创作成果自身不再需要产权激励,现有的商业实践也支持这一结论。从使用者贡献角度,其指出用户是否有独创性贡献,只能通过个案判断,社会能够适应对部分AI生成物的版权保护。
清华大学法学院程啸教授从民事主体的角度对人工智能生成物的知识产权保护问题进行探讨。他指出,我国民法确立了自然人、法人和非法人组织等三类民事主体。虽然立法者承认民事主体法律地位的理由各不相同。但是,共同的地方也是最根本的地方在于:这些民事主体,要么就是自然人,要么是自然人组成或控制的组织体。
人类还是在为自己立法,在调整和规范自己的行为。目前的人工智能技术依然受控于人,因此,还是属于现行民事主体开发或使用的产品或服务而已。因此,所谓承认人工智能创造的作品的知识产权,本质上依然是赋予既有的民事主体以著作权等民事权利,当然,基于不同的利益考虑,权利可能给人工智能产品的开发者,也可能给使用者(即用户),由此产生的侵权责任也相应地要由这些主体来承担。
在自由讨论环节,由清华大学法学院蒋舸副教授进行主持。她指出,关于人工智能生成内容的讨论逐渐聚焦,已经从第一阶段不区分机器贡献与人的贡献的泛泛而谈,进入到了聚焦人类用户贡献的第二阶段。各位专家学者就人工智能生成物的知识产权保护问题展开激烈讨论。
中国人民大学法学院张新宝教授指出,随着人工智能技术的不断发展,人工智能能够完成过去需要由人类亲自完成的事情,人工智能开发者或提供者应当享有权利。人工智能开发者或者提供者不是通过产生某种作品获得利益,而是通过固定的用户使用获得利益。就人工智能的民事主体地位而言,现阶段人工智能尚不具备民事主体地位。最后,著作权法上的独创性要求并不高,赋予人工智能生成内容以著作权不会对社会产生负面影响,至于其能否实现著作权带来的利益在所不论。
北京大学法学院张平教授指出,关于人工智能生成内容的著作权保护主要存在作品性和作者的权利归属两个问题。首先,作品性的问题并无太多讨论的必要,因为无论是否承认人工智能生成内容为作品,其已经在市场上存在了。其次,人工智能生成内容著作权人的确认是多元的,完全由使用者控制,著作权归使用者,完全自动生成则归开发者或投资人,可以通过合同约定、委托等方法确定权利归属。她提出,《著作权法》应改变一条规则,即署名权和著作权是分离的。人工智能生成内容必须进行标识,但这只用于表明来源,标明出处并不意味着署名,署名人即为著作权人这点需要突破。
北京清律律师事务所首席合伙人熊定中律师提出,第一,应当保护权益和用著作权保护是两个概念,通过反不正当竞争法进行保护也是一个值得考虑的保护方向;第二,大量具有个性化的提示词的设计,确实凝集了人类智慧的创造性,但并不必然导致对于AI的输出拥有著作权;第三,给予用户著作权与先前案例相悖。此前对于更为复杂、更具创造性的动态视频画面,所有判例都不接受用户主张游戏画面著作权,而对于静态图片却给予用户著作权,与此前判例的裁判观点并不统一。
中国政法大学数据法治研究院张凌寒教授指出,是否赋予AIGC著作权与虚拟财产的法律保护问题类似,无论是游戏装备还是AIGC,既有机器或者整个网络运营环境的重大贡献,也有人类在其中提供了智力、时间、精力。论证虚拟财产是否给予排他性保护时,会涉及洛克的劳动赋权理论或者证实有一定的支配性和排他性等理论,其实这些理论框架可以用来类比AIGC的著作权。
中国社会科学院大学法学院刘晓春副教授指出,著作权要保护的是智力投入,在人工智能生成内容场景下,用户输入指令能够体现智力上的个性化选择。用户输入指令与图片生成之间存在对应关系,只不过这种联系在不同创作过程中存在不同的密度,是否需要区分这种关联的紧密程度进行法律评价,有待进一步探讨。
清华大学计算机系助理教授艾清遥针对技术问题做出进一步回应。他指出,当人类无法判断与其交流的是人还是机器时,即通过了图灵测试。目前,人工智能技术在部分任务上已经通过图灵测试,虽然还没有完全实现通用人工智能,但也意味着人工智能技术的发展已经进入了新的阶段。他还提出,文生图的原理和大语言模型在模型形式和算法构造原理存在一些差异,但是在构建的方式上基本是类似的。
中国科学院信息工程所正高级工程师戴娇从技术角度对人工智能生成内容的引用问题做出回应,其指出现在已经有很成熟的技术可以做到这一点。在生成小论文等内容的时候可以给出整个思维链,其中会明确列举所有参考文献,因此相关权益保护和追溯是可以实现的。关于取证问题,其指出国家正在推动人工智能生成内容标识方面的国标建设,包括显式标识和隐式标识,不过目前从实践角度标识技术成熟度还不够。
清华大学法学院教授崔国斌提出,人工智能系统的用户如果只是在单一回合输入文本指令,通常不能够对人工智能系统生成的图片本身主张权利,因为用户的贡献在于输入的一段复杂的文本指令,但人工智能可能基于用户输入文本指令呈现出无数种可能的图片。除非通过文本指令把画面构图或表达要素描述得特别清晰,使所有读者脑海里有清晰的画面感,此时文本指令的输入才意味着用户对画面构图或者构思构成创作意义上的贡献,使人工智能生成物产生著作权。
北京互联网法院综合审判一庭副庭长朱阁从保护路径、审理要点、独创性判断三个方面进行阐述。第一,人工智能生成物保护的路径选择需要进行体系化思考,从著作权、反不正当竞争法、财产权保护等多种路径中选择;第二,人工智能生成物相关案件的审理需要特别关注技术原理以及人的参与程度问题;第三,关于独创性的主流意见还是有无的问题,而非高低的问题。
第二单元
训练数据的利用与保护
在引导发言环节,主持人张凌寒教授谈到,有关训练数据的利用和保护实际和AIGC生成物的可版权性是一体两面。同样也发生在前端和后端,一方面我们国家人工智能产业发展仍处于追赶位置,能决定大模型能力的高质量语料库中中文语料库仅占4%。另一方面许多原创作者也切实希望能够分享AIGC大模型带来的利益,若其本身具有著作权的内容无法分配利益,是不公平的。第二单元聚焦训练数据的利用与保护,专家们展开了激烈精彩的讨论。
主旨发言环节,中国人民大学法学院张新宝教授在发言中谈到大模型中的著作权使用问题,著作权时代又称之为知识经济时代赋予的权利保护。但许可使用或有偿使用为原则,到数字经济时代是否依然适用?张教授认为应当以开放使用为原则,有偿或无偿要根据场景、用户类型、模型类型来确定。不能固守著作权保护的思路,要在知识经济向数字经济过渡的过程中分析利益相关者的利益变动情况,将受损与受益补齐,这才是贯彻数字经济二十条的基本思路。
北京大学法学院张平教授认为,人工智能生成著作权的问题是一体两面,一是生成后的著作权的问题,一是训练过程中著作权的问题。张教授围绕生成式人工智能著作权合法性的解决方案提出观点。如果开发者共同承担责任,本着权利和义务对等原则开发者也应该享有生成物的权利。在解决方案上,人工智能的著作权问题的挑战在于思想与表达的二分。另一挑战是署名权和著作权的分离。署名不意味着给它人格、给它法律主体地位,署名应该是一种标识,是一种出处,是一种客观表达,防止人类去剽窃机器的成果。因此应该整体反思知识产权制度在数字经济时代的一个变革。
在自由讨论环节,由中国政法大学张凌寒教授主持。熊定中律师首先提出,大模型的训练是不是直接指向替代性的输出,是判断是否侵权的关键。在没有侵害性的情况下,生成物不在原权利范围之内。若产生替代性,则可以通过增量学习或模型修正的方法把涉及侵权信息的内容通过新一轮训练解决掉。
中国社会科学院大学法学院刘晓春副教授从经济分析、价值判断的角度对训练数据治理提出观点。人工智能训练数据中的复制和著作权中的复制权不同,人工智能只关注词频的概率,不对每一个作品进行区分复制。另外,如果不提供保护与补偿激励,是否会导致外部性的问题,对原有业态利益产生损失,仍是可以探讨的。
清华大学法学院蒋舸副教授认为,在输入内容和输出内容有可能构成两个市场的情况下,应当从理念上对这两个环节分别进行讨论,哪怕这两个环节最终得出的结论可能具有一致性。著作权法虽然是权利法,但高度关注被告使用行为的具体形式,这导致即便是类型化的合理使用行为,也不能完全豁免于三步走或四要素的个案利益平衡分析,除非使用者的责任在受控行为已经被完全排除。合理使用有一套以市场失灵为核心的底层逻辑,任何具体问题的判断都离不开对这套底层逻辑的关心。
抖音集团互联网法律研究中心主任丁道勤对域外国家立法保护思路和司法案例进行了介绍分析,认为从价值论和解释论角度,生成式人工智能训练语料著作权采取合理使用,而不是法定许可和自由谈判,符合我国人工智能产业发展实践的现实需求。
百度AI业务法务负责人徐全全认为,在界定大模型对训练数据的使用是否构成侵权前,应回归大模型技术的本质,厘清相关误解,为大模型对训练数据的使用提供更包容创新的合规规则。
北京大学法学院张平教授在总结中指出,本单元讨论了人工智能从开发到应用的前端和后端著作权的问题,训练数据的著作权以及应用结果的著作权的问题,包括可作品性的问题。有一些著作权人的思想已经发生了转变,例如维基百科只要求署名权,人工智能服务商仅需要标注适用了哪些语料库即视为尊重了著作权。未来如何恰当适度地进行保护以引导产业健康发展是我们的共同关注。
《中国法律评论》常务副主编袁方作为学术支持代表,提出可以选取核心议题及争论点继续进行深入讨论,中法评会考虑将今天会议的未尽议题以对话栏目的形式呈现,从而进一步推动产学研各界对生成式人工智能中知识产权问题的研究与共识。
结束语
生成式人工智能技术是一项具有革命性的创新技术,对于人类社会的发展和社会的进步具有巨大的潜力和价值,但同时也带来了许多新的问题和挑战,需要不断探索和完善相应的治理机制。希望本次会议能够为我国在该领域的法律研究和实践提供一个良好的平台和契机,促进各方的交流和合作,共同推动我国生成式人工智能的健康和可持续发展。
中国法律评论
我刊由中华人民共和国司法部主管、法律出版社有限公司主办。国家A类学术期刊,中文社会科学引文索引(CSSCI)来源期刊,中国人文社会科学期刊AMI综合评价核心期刊。我刊秉持“思想之库府,策略之机枢”之理念,立足于大中华,聚焦中国社会的法治问题,检视法治缺失与冲突,阐释法律思想,弘扬法律精神,凝聚法律智慧,研拟治理策略,为建设法治中国服务,为提升法治效能服务,为繁荣法学服务。
《中国法律评论》投稿邮箱:
chinalawreview@lawpress.com.cn
中法评微信公众号投稿邮箱:
stonetung@qq.com
刊号:CN10-1210/D.
订刊电话:010-83938198
订刊传真:010-83938216
评论
沙发等你来抢