知恒资讯

法律咨询热线:0755-8889-0066

知恒释疑 | 生成式人工智能的版权问题与合规挑战
发布日期:2023-10-23 浏览188次

作者 | 知识产权中心 王琼花律师


前言


随着科技的飞速发展,人工智能技术逐渐深入到我们的日常工作和生活,生成式人工智能更是其中的佼佼者。2022年11月30日,Open AI公司发布聊天机器人ChatGPT[1],上线不久便火速出圈,得到了快速推广和应用,已成为一种现象级的文化轰动。ChatGPT,可以说取得里程碑式突破的AI产品。

其中,生成式人工智能在文本、图片、音频、视频等领域的应用尤为广泛。它通过学习大量的数据,能够根据用户的需求,自动生成新的文本、图片、音频、视频等内容,大大提高了生产效率,降低了创作成本。然而,与此同时,生成式人工智能也引发了许多版权问题和合规挑战。如何确保我们在享受科技带来的便利的同时,不侵犯他人的知识产权,成为了一个亟待解决的课题。


生成式人工智能生成物是否享有版权


我们首先要明确的是,生成式人工智能生成的内容是否享有版权。根据我国现行的《著作权法》规定,只有自然人、法人或其他组织创作的具有独创性的作品才享有版权。那么,由人工智能生成的内容是否符合这一条件呢?


1. 国内司法判例

如何判断生成的内容是否具有独创性,是一个相当复杂的问题。在这里我们用两个案例来分析,第一个案例是腾讯公司与“网贷之家”著作权纠纷案,南山法院认为案涉文章具有独创性构成作品、网贷之家未经允许进行转载构成侵权。第二个案例是北京菲林律师事务所与北京百度网讯科技有限公司著作权纠纷案,北京知识产权法院认为人工智能生成的报告不具有独创性,不受著作权法保护。


腾讯案中,涉及的AI生成物是腾讯公司使用Dreamwriter软件生成的一篇财经分析文章。这个案件是“中国AI作品第一案”,是全国首例认定AI生成的文章构成作品的生效案件,判决针对AI生成物的独创性判断步骤做出了一些探索和创新。

针对AI生成物是否具有独创性的问题,法院认为,第一,涉案文章由腾讯公司的主创团队运用Dreamwriter软件生成,其表现的内容体现出对当日上午相关股市信息、数据的选择、分析、判断,文章结构合理、表达逻辑清晰,具有一定的独创性。第二,涉案文章的生成过程主要经历数据服务、触发和写作、智能校验和智能分发四个环节。在上述环节中,数据类型的输入与数据格式的处理、触发条件的设定、文章框架模板的选择和语料的设定、智能校验算法模型的训练等均由主创团队的相关人员进行选择与安排。本案中腾讯公司主创团队在数据输入、触发条件设定、模板和语料风格的取舍上的选择与安排,属于与涉案文章的特定表现形式之间具有直接联系的智力活动。因此,从涉案文章的生成过程来分析,该文章的表现形式是由腾讯公司主创团队相关人员个性化的安排与选择所决定的,其表现形式并非唯一,具有一定的独创性。

这个判决没有明确指出著作权法意义上的作品应当是由自然人创作的,但明确了独创性的两层含义,一是强调相关的表达由腾讯公司的主创团队人员独立创作;二是体现了创作者的个性化选择、判断和技巧等因素,属于人类的智力活动成果。这也可以说明,讨论独创性是建立在人类参与的前提条件上。

菲林律所案中,法院认为独创性强调作品必须是作者独立创作的,而不是复制的。著作权法上的独创性的核心在于被创作的作品与创作者之间的关系:作品是作者思想情感的表达——要求作品来源于作者。作者的思想情感是作品的灵魂,先有作者才有作品,作者是作品独创性中不可缺少的内容。由计算机程序自动生成的分析报告,没有体现作者的思想情感,无法成为著作权法保护的客体。


关于威科先行库自动生成的分析报告是否构成作品的问题。从分析报告生成过程看,选定相应关键词,使用“可视化”功能自动生成的分析报告,其内容涉及对电影娱乐行业的司法分析,符合文字作品的形式要求,涉及的内容体现出针对相关数据的选择、判断、分析,具有一定的独创性。但是,本院认为,具备独创性并非构成文字作品的充分条件,根据现行法律规定,文字作品应由自然人创作完成。虽然随着科学技术的发展,计算机软件智能生成的此类“作品”在内容、形态,甚至表达方式上日趋接近自然人,但根据现实的科技及产业发展水平,若在现行法律的权利保护体系内可以对此类软件的智力、经济投入予以充分保护,则不宜对民法主体的基本规范予以突破。故本院认定,自然人创作完成仍应是著作权法上作品的必要条件。上述分析报告的生成过程有两个环节有自然人作为主体参与,一是软件开发环节,二是软件使用环节。软件开发者(所有者)没有根据其需求输入关键词进行检索,该分析报告并未传递软件研发者(所有者)的思想、感情的独创性表达,故不应认定该分析报告为软件研发者(所有者)创作完成。同理,软件用户仅提交了关键词进行搜索,应用“可视化”功能自动生成的分析报告亦非传递软件用户思想、感情的独创性表达,故该分析报告亦不宜认定为使用者创作完成。综上,软件研发者(所有者)和使用者均不应成为该分析报告的作者。分析报告系威科先行库利用输入的关键词与算法、规则和模板结合形成的,某种意义上讲可认定威科先行库“创作”了该分析报告。由于分析报告不是自然人创作的,因此,即使威科先行库“创作”的分析报告具有独创性,该分析报告仍不是著作权法意义上的作品,依然不能认定威科先行库是作者并享有著作权法规定的相关权利。有关分析报告的署名问题,无论是软件研发者(所有者)还是使用者,非创作者都不能以作者身份署名,应从保护公众知情权、维护社会诚实信用和有利于文化传播的角度出发,在分析报告中添加生成软件的标识,标明系软件自动生成。

因此,从现行法律规定来看,人工智能生成的内容并不享有版权,事实上,无论是大陆法系还是英美法系,只有自然人创作的作品才可以获得著作权法/版权法的保护。在中外司法实践中都体现了这一司法精神。


2. 美国司法判例

用一个美国的案例来说明。今年3月,美国版权局对AI作品著作权的一项裁决引起了社会广泛关注。美国版权局裁定一位作者使用绘画工具Midjourney[2]创作的插画不受著作权保护,理由是该作品主要由机器生成,而非人类创作。这位作者不服,向法院起诉。

8月18日,华盛顿特区联邦法官做出裁定,根据美国法律,人工智能在没有任何人类输入的情况下创造的艺术作品不能获得版权,因为它缺乏“人类作者”的身份。这一裁决标志着美国对AI生成的艺术作品设立了这样的界限,并重申了美国版权局今年 3 月做出的裁决——仅靠AI生成的作品不符合版权保护的条件。

这位作者和他的律师团队一直认为应该对AI生成的作品和发明授予版权和专利保护,并且向版权局、专利局做了申请但目前没有获得任何授权,美国法院和美国专利局认为,知识产权只应授予人类创作的作品。

因此,AI作品是否应被赋予著作权以及归属于谁,将直接影响产业各方的根本利益,甚至也将决定文化产业发展新格局。


美国版权局驳回了多项人工智能生成内容的版权登记申请,美国版权局认为,美国司法实践始终坚持,只有人类创作的作品才符合对其提供版权保护的法律要求。即使有些作品并不是纯粹由人工智能生成的,但如果人类的参与并没有对人工智能起到控制作用,不能决定一个确定性结果的生成,那么此时人工智能就不能称为人类创作的辅助工具,人类仍不能被认定为该人工智能生成内容的作者。


生成式人工智能的合规挑战


权利和责任是对等的,广泛的权利索取可能带来的会是无尽的法律风险。AIGC企业以及使用者在可能面临哪些风险和挑战?在此做一探讨。

一、侵犯知识产权

大量训练数据来自于对受著作权法保护作品的挖掘,我国现行著作权法的合理使用条款仍采取法定主义,类似文本挖掘行为等很难构成合理使用,如果开发者没有获得作者的授权,那么该行为将可能导致对作者著作权侵权;在人工智能生成的文本、图片、音频、视频等等内容中,可能会使用受著作权法保护的作品,甚至有可能包含商业机密信息,那么使用者可能面临侵权;还可能出现前后生成的内容相同,之后生成文章的使用者可能侵犯在前生成文章使用者的权利的情形。

二、侵犯肖像权、隐私权

人工智能生成的内容还可能涉及侵犯他人肖像权、隐私权等问题。例如,在人工智能生成的图片、视频中,可能会无意间暴露他人的肖像或隐私信息。

三、侵犯个人信息

未经同意使用公民个人信息、超出合理范围使用已公开的个人信息。《生成式人工智能服务管理暂行办法》第七条第三款的规定,涉及个人信息的,应当取得个人同意或者符合法律、行政法规规定的其他情形;《个人信息保护法》第13条也有相关规定。但在具体的数据训练环节,期待开发者对每个用户都做到知情同意几乎是不可能实现的。对于已公开的个人信息的合理使用范围以及是否属于“个人权益有重大影响”仍存在极大的不确定性和合规隐患。

四、违反网络安全法

使用通过爬虫抓取的数据,一方面,通过爬虫手段爬取用户信息可能因为手段的使用对目标业务和站点造成影响,并违反我国网络安全法第27条有关禁止个人非法获取个人信息的规定;另一方面,该行为也同样可能构成不正当竞争,擅自爬取行为可能违反《反不正当竞争法》相关规定而导致合规风险。

五、训练数据可能存在虚假、错误信息

由于AI生成内容不提供出处、真实性并不关注、合理性不做判断,极容易生成虚假信息,对公众造成误导。


是否适用合理使用规则免责?


针对知识产权侵权风险,是否构成合理使用至关重要。对于AIGC是否构成合理使用,世界各国态度不一。正方认为,对现有作品的转换性使用,符合合理使用的情形;如果以获得作品前置性授权许可并为此支付费用为前提,将会增加成本投入从而影响产业的长远发展;反方认为如果将其认定为合理使用,人类作者既无法基于现有作品获得激励,也将会客观面临AIGC对于人类作者创作空间的挤压,从而最终影响到著作权制度的实施。

笔者认为,根据我国著作权法及相关规定,难以构成合理使用。欧盟通过的《单一数字市场版权指令》要求各成员国应当规定指定有关科学研究为目的文本与数据挖掘的版权例外,此项为法定例外,不可以通过协议约定排除。美国采用四要素判断法,对于符合标准的可能会被认定为合理使用。OpenAI针对集体诉讼也提出了合理使用的抗辩,认为版权法是有限的垄断,通过限制和例外(包括合理使用)为创新留有空间,OpenAI的行为落入合理使用的范围。美国法院是否支持拭目以待。


应对措施


面对生成式人工智能的版权问题和合规挑战,我们应当采取以下几个方面的措施:


首先,完善立法。我们应该根据人工智能技术的发展趋势,及时修订《著作权法》等相关法律法规,明确人工智能生成的内容的版权问题,并为侵犯他人知识产权、肖像权、隐私权等问题制定相应的法律条款。在这方面,我国已经出台了一系列法律法规,对生成式人工智能进行规范。例如,《互联网信息服务深度合成管理规定》明确规定,利用生成式人工智能技术向境内公众提供生成文本、图片、音频、视频等服务,应当尊重社会公德和伦理道德,不得利用算法、数据、平台等优势,实施垄断和不正当竞争行为。又如,《生成式人工智能服务管理暂行办法》明确规定了生成式人工智能服务提供者应当依法开展预训练、优化训练等训练数据处理活动以及应当遵守的相关规定。这些规定对于保障生成式人工智能的健康发展,具有十分重要的意义。

其次,提高公众的法治意识。当然,面对生成式人工智能的版权问题和合规挑战,我们不能仅仅依靠法律法规,还需要各方共同努力,形成合力。作为生成式人工智能的服务提供商,我们需要不断提高技术水平,确保生成的内容合法、合规;作为用户,我们需要增强版权意识,尊重原创,抵制侵权行为;作为政府监管部门,我们需要加强对生成式人工智能的监管,引导其健康、有序发展。

总之,生成式人工智能的版权问题和合规挑战是一个跨学科、跨领域的复杂问题,需要我们共同努力,共同解决。我相信,在不久的将来,我们一定能够找到一个既符合现行法律规定,又能够保障各方权益的解决方案。


[1] 生成型预训练变换模型(Chat Generative Pre-trained Transformer,ChatGPT),是OpenAI开发的人工智能聊天机器人程序。

[2] Midjourney是一个基于人工智能的系统,它根据用户输入的文本提示生成图像。卡什塔诺娃撰写了《黎明的查莉娅》的文本,而Midjourney根据提示创作了书中的图像。



律师简介


66202cacdeefda10b908a10d61d2febd.jpg

王琼花 律师

知恒律师事务所 合伙人律师

深圳市律协著作权法律专业委员会 秘书长

知恒知识产权中心秘书长、著作权委副主任

专业领域:

知识产权(刑民交叉)、企业合规

公司法律顾问、民商事争议解决


著作代表

《隆安律师解读民法典》合同编

《网络法学教程》

《深圳市福田区人民调解典型案例评析》


联系方式

18718517127



中心简介


c768fe45d022c9aca7304ea1598a1826.png

知识产权中心

知恒知识产权中心目标:立志于打造一流的知识产权法律服务中心。

知识产权中心拥有专利、商标、版权、商业秘密、维权、国际、布局分析、运营交易等完整知识产权专业化部门设置,形成从基础申请、规划布局、风险防控、打假维权、运营交易、国际保护等完整的全产业链条。

知识产权中心拥有一流知识产权专家团队领衔,具备完善的服务流程及一体化的服务体系,在全球知识产权的各个领域提供专业法律意见及解决方案,力争让每一个案件、项目都可以得到专家参与制定的最优的解决方案,让客户体验到最严谨、专业的服务。



本文及其内容为知恒律师分享,仅为交流目的,不代表律所或律师出具的法律意见、建议或决策依据。如您需要法律建议或法律专业分析,请与知恒律所专业律师联系,或私信微信公众号留下您的联系方式。本文如需转载,请在后台联系公众号编辑。


法律咨询电话:0755-8889 0066

电话:0755- 8889-0066
传真:0755-83184636
地址 :广东省深圳市福田区广电金融中心22层
邮编:518000
微信公众号:知恒律师事务所
微博:知恒律师事务所