半岛综合体育近年来在计算机硬件、分布式训练、云计算等技术的加持下生成式人工智能(Artificial Intelligence generated content,简称AIGC)技术得到了突破式的发展。AIGC通过高级生成人工智能(Generative artificial intelligence,简称GAI)技术来生成内容,这些生成的内容不再依赖人类作者。国内产学研各界将AIGC理解为继专业生成内容(Professional Generated Content,简称PGC)到用户生成内容(User Generated Content,简称UGC)之后,利用人工智能技术自动生成内容的新型生产方式。
早期AIGC技术只能根据事先指定的模板或规则进行内容制作和输出。近年来,深度学习中的损失函数和梯度下降等技术快速迭代,借助大语言模型(Large Language Model,简称LLM)AIGC可以生成不同模态的数据内容,AIGC生成的新作品可呈现图片文本、音频视频半岛综合体育、游戏脚本、代码开发等诸多形式。OpenAI在这场AIGC变革中发挥了关键作用,其旗下的自然语言处理技术ChatGPT和图像处理技术DALL-E2及其衍生技术被广泛应用于各个领域。ChatGPT技术通常被用于构建对话式人工智能系统的语言模型,它可以高效地理解并以有意义的方式响应人类的语言输入。DALL-E2同样是由OpenAI开发的最先进的GAI模型,它能在几分钟内从文本描述中创建具有独特性的高质量图像。正是因为AIGC的应用能带来广泛的经济效益,国内外诸多知名公司都开始AIGC的产业布局,并积极将生成式人工智能应用于其产品中。
AIGC极大地提升了创作效率,可在数秒内自动生成上万字的文章。随着AIGC技术的发展演进,AIGC将会越来越善于模仿人类,其超越人类作者也只是时间问题。可以想象随着AIGC商业化的速度加快,今后将会有更多的AIGC作品出现。AIGC作品创作及生成过程已经超出了严格意义上的智力创造,相应地引发了一系列著作权问题,并对已有的知识产权制度构成了挑战。在这些挑战中最关键是,权利客体和创作主体的资格问题。一方面,要追问人工智能生成内容是否具备作品的构成要件,这是权利客体资格问题;另一方面,要追问人工智能是否实现了真正的思想和精神智能化、是否具备了创作的独立性,这是创作主体资格问题。
著作权自产生以来其发展的重要支点便是作者,通常来讲作者与作品相对,没有作者就没有作品,反正亦然。在传统意义上作者身份一直是专属于人类的特权。早在十三世纪,西方就已经开始承认智力作品的作者是作品权利的自然持有者,到了十四世纪,人文主义哲学的出现使得社会更加注重人类的创造力和智慧,强调人类本质和人类的价值。十五世纪中叶欧洲引入了印刷机,印刷机的大规模使用使得书籍文本等印刷制品能被更广泛地传播和阅读,这一过程加速了向个人主义作者身份的转变,随之而来的结果是作者社会地位的提高。作者姓名的认定是确定作品归属的先决条件,从某种意义上来讲,当作者的名字出现在书籍扉页上时作者和作品之间才能够建立起了更深刻的联系,此时才可以说“作者”这一概念才是真正的出现了。由于欧洲很多国家在十六世纪尚未建立作者命名体系,这直接限制了指出作品作者姓名的能力,这种情况一直延续到十七世纪作者才能以自己的名义出版作品,并被承认为作家。英国在1662年出台了世界上第一个许可证制度,即《出版管制法》(The Licensing of the Press Act)对出版业进行控制,该法规定:凡书籍、小册子或论文必须经主管机关或至少经主管者一人批准,否则不得印行。后来,都铎王朝使用垄断企业来控制报业,并称对出版业的垄断是出于公共安全和国家利益,甚至建立了控制印刷业的托拉斯——文具商公司。约翰·弥尔顿和约翰·洛克等人在结束这场文具商许可制度的斗争中发挥了重要作用。弥尔顿对长老派控制的国会制定的出版管制法进行了有力的批判,提出并论证了出版自由的主张,呼吁让一切有话要说的人能自由地发表意见。洛克基于自然法的“工作-劳动理论”证明了从体力劳动中获得财产权是合理的,保护作者的劳动不仅是自然权利的要求,更是人权的体现。这场保护作者运动的斗争在未来几个世纪的版权法中播下人类作者的种子。
直到现代主义的出现,人类作者的身份受到了一定的挑战。现代主义认为没有什么是真正的创造性和创新性,作者和创造力等概念可能是社会构建的,与创作过程中实际发生的事情几乎没有关系。罗兰·巴特作为该派别代表人物发表了的“作者之死”的言论。巴特认为一件事一经叙述作者就会步入他自己的死亡,因为作者一旦进行写作,其写作的起因就会被破坏,他指出作者是一位近现代人物,是由我们的社会所产生的。巴特强调个人作者的作用已经减弱,巴特的理论间接削弱了著作权保护。“作者之死”的理论还经常被用来论证机器作品在某种程度上与人类作者一样都是值得著作权保护的。不过“作者之死”的理论也受到了复杂主义理论的质疑。在复杂主义理论那里单独从作者或者读者的角度出发都犯了还原主义的错误。复杂理论认为作者、读者和文本都是必不可少的,从系统的角度来看,每个人都是读者和作家,这就形成了由流动的文本和反馈循环连接的作者和读者的大型网络。
AIGC作品的不断出现,对人类作者的身份带来了挑战。传统意义上作者身份是一种作为对话方式和交流行为的作者身份,存在于人与人的交流之间。作者与人类联系在一起,作为一种社会实践,甚至作为一种生活条件,人类交流是作者身份的关键。AIGC则脱离了这样的场景,而表现为一种机器与人的“交流”。事实上很多情况下人类读者并不知道作品是由人类还是机器所创作,作者已不再是单个个人,还可能是机器,人与机器之类的界限正在逐步缩小。作为人类专属的作者的身份正在慢慢被AIGC消解,击碎了只有人类才能创作的传统理念半岛综合体育,AIGC在某种意义上消解了传统意义的作者身份的内涵。
既然AIGC消解了传统意义上的作者身份,那么AIGC能否拥作者身份。有学者就提出既然非自然人的法人和非法人组织可以成为著作权人,人工智能就应该被法律赋予著作权主体资格。然而人工智能与人类作者之间还存在着根本的区别,这种区别在一定程度上维护了人类作者的身份。AIGC作品只是通过大数据、云计算等方式获取人类已有的作品并进行训练和学习,按照人类的语言等习惯在一定算法下生成的相应作品。人工智能并不具有人类的身体和人类作者的思想、精神,它无法对生活进行感知。即使一台机器预测了所有正确的单词,它既不知道也不理解单词组合的内涵,更不用说整个作品的意义或价值了。人工智能没有思想情感,其成果生成依靠的仅是计算软件和程序以及冰冷的机器,其生成的成果并非人们思想情感的表现形式。正是因为人工智能不具备人类对生活的感悟、生命的体验和非理性因素使得AIGC无法理解生成作品背后的深刻的社会意义和情感意义。
从历史上看,权利与责任相互伴随,权利和责任如同一枚硬币的两面。人类作者能够主张作品未经授权不被复制、剽窃,并有权要求从作品中获利。在著作权受到侵害时,AIGC无法自主地主张上述权利。AIGC也不具有诉讼主体的资格,在发生侵权纠纷时无法提出诉讼请求,且无法承担相应的法律责任。同样AIGC也无法进行与著作权相关的民事活动,例如,版权许可和转让等。著作权既包括著作财产权,又包括著作人身权,其人身权系著作权人的精神权利,因为人工智能不能直接享有和行使人身权利,故难以成为完整的著作权主体。从国际上讲,作者权利国际化的典型是伯尔尼公约的规定。伯尔尼公约虽然没有定义作品的“作者”,将其留给缔约方,但其文本和历史背景强烈表明,公约指的是创作作品的自然人,这意味着版权保护最初属于人类作者。公约第六条之二授予作者相关的精神权利强调,这些权利独立于作者的经济权利,版权保护的最低标准也仅由人类创作行为触发。从工具主义或功利主义的角度来看,著作权是通过赋予作者一定的物质和精神利益的奖励来激励作者的创造性活动,英国议会通过的世界上第一部版权法安娜女王法案(Anna Act),其立法目的就是为了鼓励知识创作,承认作者是版权保护的主体,通过专有权利的设置及保护来实现鼓励创作的目的。世界人权宣言规定人人对由于他所创作的任何科学、文学或艺术作品而产生的精神的和物质的利益,有享受保护的权利,这一规定必然指向人类的作者。而大陆法系国家,其著作权制度几乎都带有强烈精神权利取向,例如,法国、德国、瑞士等都完全拒绝非人类作者的概念。
著作权法只将公民、法人或其他组织作为著作权的主体,而并未将人工智能列入。人工智能既不是有生命的自然人,也不是具有独立意志并作为自然人集合体的法人。因此一旦赋予AIGC作者身份会导致原有的著作权法律体系立刻瓦解。
人工智能生成的作品是否应该受到著作权的保护并不是一个全新的问题,早在20世纪60年代学者们就已经开始努力解决计算机生成作品的问题。美国版权局在1965年将计算机作者问题与计算机程序的注册和版权局的自动化建设列为版权局面临的三大问题。在AIGC作品是否能成为著作权的客体的问题上主要存在以下几种理论。
价值保护论认为只要作品对某人来说是有价值的那么就应该受到保护,该理论最早可以追溯到英国的University of London Press v.University Tutorial Press案,法院持有值得复制的东西就是值得保护的理念。这种观点的潜在含义是如果计算机创作的作品具有商业价值,相应地就应该有人享有作品的权利。如果人工智能创造力被认为是有用的,那么不仅是人工智能本身,它的输出也必须得到保护。不过该理论也一直被人们所诟病,这是因为法律不仅保护有价值的东西也会保护没有价值的东西。
市场竞争论认为应该对计算机生成作品给予保护,如果不授予著作权保护,这些无版权作品将与授予版权的人类创作的作品相互竞争,最终会将市场变得混乱。这一理论表明,通过版权保护计算机生成作品,并使其使用受到授权和支付,将会创造一个公平的商业竞争环境。市场竞争理论注意到了计算机生成作品的市场意义,但这也引发了一个更深层次的问题,计算机不同于人,是否需要通过著作权来激励。知识产权或者说著作权法的设立是为了激励创作,而计算机并不需事前的法律激励或事后的奖励要来激励代码的运作,计算机无论多么智能,都无法像人类一样能受到法律机制的激励。如果说著作权的保护是用来激励用户创作,这样的目的也会落空。从经济学的角度看将著作权授予用户既不会增加也不会减少对最终用户的激励,因为最终用户的生产成本毕竟是零。如果著作权的保护指的是激励计算机程序的创造者,那么也会过于狭隘,即计算机程序的创造者,程序员或软件供应商通常已经有足够的激励而无需通过再增设著作权的保护来奖励,例如,对软件的版权保护,否则计算机程序的创造者将获得双倍的报酬和过度奖励。退一步讲,将著作权授予程序员或软件供应商会导致用户无法主张著作权,最终会造成软件产品无法吸引客户的结果发生。可见将现有的著作权框架严格地映射到机器创作的作品上会牵涉到著作权保护的大量成本,但好处却很少。
雇佣作品论也称为作者原则,它是创作人作为作者原则的例外,该原则主要涉及雇员在受雇期间为完成本职工作或者雇主交给的工作而创作雇佣作品的行为。这一原则能够对作品的事实作者和法律作者进行区分。通过该原则可将人类创作作品的权利授予另一个人或者法人,雇主并非事实上的作者,而只是法律上认为的作者。雇佣作品论者认为与其将作者重新定义为包括非人类,不如重新解释版权法雇佣原则中雇员和雇主的。在雇佣作品论下,机器被类比为受雇创作的作者。将计算机创作的作品视为雇佣作品看似合乎逻辑地避免了将法律权利授予机器的问题。然而将机器创作的作品权利归属于人类意味着将非人类创作赋予了人类。在雇佣作品的情形下,是存在雇员或受托人等人类创作者的创造性的活动,但如果作品只是单纯由计算机创作,那么创作的作品与人类的创造能力之间将不会产生任何关联。计算机缺乏人格的性质也难以将其定位成雇员,雇主和受雇人之间往往还存在合同等关系,由一个或多个当事人在书面文书中明确同意该作品是为雇佣而创作的,而计算机无法与雇主之间建立此种法律关系。雇佣作品更多关注的是著作权的归属问题,而非作品能否受著作权保护的问题。在雇佣作品中认定雇主为作者的目的是激励雇主进行作品创作。
衍生作品论包含两种观点,其一,衍生作品理论的一种观点认为机器和人类一样,其创作的作品是在先前存在的受著作权保护的作品基础上衍生的。作为著作权保护的一个例外,衍生作品保护那些直接或间接建立在其他人作品之上的作品。使作品获得衍生性的条件是,创作者在衍生作品中进行了创造性的活动,对原作品添加了一些实质性的并且与原作有显著不同的东西,并且衍生作品通常会反映衍生作者人格的要素。以小说为例,衍生作者不能直接地对原作品进行直接复制,但可以模仿原作品的情节、结构、风格,并添加新的材料和信息。计算机生成物则与之不同,以AIGC为例,AIGC并不是在这种意义下衍生出新的作品,深度学习等算法通常是依据数据之间的相关性作为作品创作的基础,这些作品并未具备作者的创造性表达,因此很难将其认定为衍生作品。实际上衍生作品更多的是在著作权保护下,鼓励创造力,并对智力性努力的劳动提供奖励。其二,另一种衍生作品理论认为作品是计算机程序衍生出来的作品。这一观念也值得质疑,在计算机创作的作品中,产生的作品并不是基于或衍生自底层的、受保护的人工智能软件而是由它创造的。衍生作品必须包含、取自已有作品的材料。程序生成的作品不符合该标准,因为生成的新作品实际上不包含产生它们的任何代码。它们不是从基础代码复制的。程序创造的表达和实际程序本身的表达之间的相似性通常是不存在的,作品和创建它的底层程序代码很少或没有相似性。
美学论者认为只要作品具有美学意义就应该受到保护,但该理论被欧盟法律所拒绝,欧盟法律拒绝将艺术或质量价值作为作品受保护的标准。上述这些理论虽然从不同角度阐述了人工智能生成作品能否受著作权保护的问题,看似具有一定的合理之处,但都未能从根本上解决人工智能作品能否成为著作权客体的问题。回答这个问题还需要从人类与人工智能之间在创作中的根本区别进行探讨。
作品能够获得著作权的保护需要满足一定的条件。首先,所属领域的要求。著作权法要求作品属于文学、艺术和科学等领域。AIGC作品通常都会满足著作权对作品所属领域的要求,AIGC已经能产生文字作品、音乐、美术、视听等作品。其次,固定性要求。固定性要求作品必须存在于有形的媒介中,作者的表达必须以某种方式被察觉,没有给定形状或形式的想法不能被称为“作品”,AIGC作品显然也满足固定性的要求。最后,创造性要求,创造性也是作品获得著作权保护,取得著作权保护收益的必要条件。既然创造性是获取著作权保护的重要条件,那么AIGC是否具有创造性就成了核心的问题。在人工智能生成作品能否拥有著作权的问题上,创造性主要包括两种观点,即客观的创造性和主观的创造性。
这种观点着眼于创作的结果,不考虑创作的参与者,否认人类与作品创作的联系。持这种观点者大都认可图灵测试,认为只要机器生成的作品能通过图灵测试,即无法区分作品是人类还是机器产生,那么就应该视为作品具有创造性,应该获得著作权的保护。当人工智能创作物在表现形式上同人类创作作品完全一致,以至于如果该作品是人类创作完成,则毫无疑问可以被授予版权时,我们是否根本无需考虑该作品的创作者是人工智能还是自然人的问题。
创造性要求做意想不到的事情或偏离规则的事情,在创造性下会产生新的、令人惊讶的以及有价值的作品。如果我们将不可预测性作为创造性的构成要素,我们可以通过命令机器在它们被编码做出的一些选择中做出不可预测的行为来使它们具有创造性。在这点上AIGC无疑可以做到不可预测性,通过将随机因素融入计算机的处理过程中,计算机可以被编程来产生意想不到的结果。随着对抗神经网络等算法的发展,人类不再直接影响和决定结果,正是这种不可预测性证明了人工智能的自主性和创造性。以ChatGPT为例,ChatGPT会先从海量的数据中收集到相关的信息,再根据信息的相关程度进行排序筛选。具体而言,ChatGPT的自注意力机制(Self-attention Mechanism)会对句子片段中每个词的相关性打分,并将这些词的表示向量根据相关性加权求和,从而让模型能够将词和其他相关词向量的信息融合起来,最后通过自然语言等算法对筛选的内容进行重组。而ChatGPT的核心技术人类反馈的强化学习RLHF(Reinforcement Learning from Human Feedback)能帮助语言模型更好地理解和生成自然语言,并且帮助缓解语言模型中的偏差问题。有学者将ChatGPT生成过程定位为“智能搜索引擎+智能文本分析器+智能洗稿器”。虽然ChatGPT并未贡献新的观点,只是对原有的素材按照一定的语言规则进行了判断、选择和组合,但著作权法并未否认未具备新观点的内容可以受到著作权的保护,只要作品在文字组合上具有创造性那么就可以认定作品具备创造性,并且ChatGPT生成的作品也很容易满足创造性程度的最低要求。博登(Margaret Boden)进一步将有关计算机的创造力分为两种情况:心理创造性(P-创造性),对于产生它的人来说是新颖的思想,其他人以前有过多少次这种想法并不重要;历史创造性(H-创造性),它也属于P-创造性,但在历史上从来没有发生过,它需要产生对整个人类历史来说是新颖的思想。博登认为通常计算机模型为了P-创造性,但有时以H-创造力为目标,甚至达到H创造力。
客观的创造性的理念也体现在一些国家的立法中,在人工智能生成物的立法上,英国等国家的立法更强调著作权中的经济权利,鼓励人工智能技术的创新,并促进其用于公共利益。英国颁布的一些法规否认使计算机生成的作品必须起源于人类。经济权并不是基于作品反映作者个性的概念,由于它强调著作权的经济方面,它并不关心著作权作品与其创作者“个性”之间关系的形而上学概念。
这种创造性观通常将人类与创造性关联,认为创造性需要人类的火花才能存,这种价值观注重人类的思想情感和丰富的想象力等内在思维活动。约翰·塞尔(John Searle)的中国房间假设就是这种观点的代表,塞尔强调意向性要求是实际智力的先决条件,人工智能只是对遵守规则所产生的技能的模拟,没有意图因此没有真正的智能活动,没有一个程序本身足以思考。抛开未来具有自由意志的超级人工智能或者说完全自主的机器人的场景,目前的人工智能在很大程度上依赖于数据的驱动,他们还没有先进到能够进行独立思考,对自己的创作行为进行判断。即使是最具复杂性的人工智能,例如,通过对抗性神经网络来生成输出的机器,也是复杂的算法指令集,其创作能力还是会依赖于设计的程序员。机器学习虽然能进行自我调整改进,例如,深度学习中的损失函数和梯度下降算法可以快速地调整深度神经网络参数,从数据中进行学习功能,并进行自我优化,但本质仍然是一个基于程序员控制的过程,程序员决定机器应该做什么,在模型训练集中包括哪些数据,模型应该在其训练集中寻找什么。对于人工智能生成内容而言,即便在表现形式上与人类作品几乎没有差别,但由于是应用算法、规则和模板的结果,其生成过程没有给人工智能留下发挥其聪明才智的空间,不具有个性特征,该内容并不符合独创性要求,不能构成作品。
创造性意味着独创性,而独创性又意味着个性化,创造性的选择。创造性不仅仅指作品本身具有创造性,而是作者能够通过自由和创造性的选择来表达他在作品制作中的创造性能力,有足够的智力创作空间存在。创造性强调作者在作品中表达自己的个性、风格,而以非创作性的方式做出自由的选择并不能受到著作权的保护。人类创造者以反映其个性的方式、创造性地、原创性地、独立地从他或她的思想和灵魂中创作了作品。一部作品是由某人创作的,那么这个人个性的某些方面将会在其中得到反映,这种个性的最低限度的反映足以证明支持版权的智力创造性。在Eva-Maria Painer v Standard VerlagsGmbH一案中,法院认为智力创作必须反映作者的个性,如果一个主题能够被认为是原创的,那么这个主题反映了作者的个性,作为他的自由和创造性选择的表达,这既是必要的,也是充分的。
创造性还意味着作者的创作行为与作品的表达形式之间存在因果关系,作品不仅需要体现人类的能动性或干预,还需要一定程度的作者意图,这一定义明显排除了完全随意的自然行为,例如,花朵的形状,花朵形状很显然源自自然而不是人类的想法,即使具有美学意义或艺术价值,也无法视为作品。创造性要求作品的变化不仅仅是“微不足道的”,而是要求某种程度可识别的“他自己的”变化。例如,美国的Feist案(电话号码簿案)终结了“额头上的汗水”的考量,确立了作品至少拥有一定程度的人类创造性才能获得版权法的保护。
大陆法系国家大都是主观创造性观念的代表,这些国家强调著作权中的精神权利,旨在对作者的人格进行保护,认为作者的个性和作品之间具有不可分割的“脐带”一样的联系。大陆法系著作权以人类为中心,这主要源于其人格权理论的历史基础。以德国为例,根据德国版权法第2(2)节,该法律规定法律意义上的“作品”只能是个人的智力创作。在主观创造性观念下AIGC拥有类似人类的“创作”能力不应该用来证明其具有“创造性”。
创造性的定义对AIGC创作作品的著作权问题至关重要。如果我们将创造性定义为一种典型的人类能力,那么计算机就永远不可能成为作者,我们基本上可以止步于此,但如果我们将创造性定义为一系列特征或行为,那么创造性可能是可以编码的。正如有学者所言计算机是否真的有创造性,这不是一个科学问题,而是一个哲学问题,目前还无法回答,因为它涉及几个极具争议性的,也非常不清楚的哲学问题,这些包括意义的本质,或内涵;心理学或意识的科学理论在原则上是否可能;以及计算机能否被接受为人类道德共同体的一部分。
在这种模式下计算机只具有工具性质并且只是一种惰性的工具,是人类创作行为的机械延伸,只有在被人直接或间接激活时才能发挥作用。在创作过程中计算机只是按照预先设定的程序代码运行,辅助作者完成创作活动,其产生的结果也在主体的预见范围之内。创作者会采取具体的步骤来控制最终作品,作品会呈现创作者自己的原始心理概念,并赋予作品可见的形式。以摄像机为例,摄像机提供了一种表达摄影师对图像视觉的手段,而摄影师控制了这种手段,那么这台摄像机并没有取代摄影师。因此AutoCAD、Photoshop这类计算机软件最多只能纳入普通工具的范畴,在这类工具下,作品通常由人类的指导完成的,并由人类决定作品中表达的内容,或者说人类几乎决定了一切。人类对最终作品占据了主要的创造性贡献,而计算机对生成作品的创造性贡献也是最小的,或者说是不存在,不明显的。这种场景下生成的最终作品显然不会因为使用机械手段而被剥夺著作权的保护。
在部分生成式作品的创作过程中人类与人工智能之间存在一定的互动。人类和人工智能都共同参与了作品创作,并且两者都不能单独完成最终作品。在最终作品中人类和计算机的创造性贡献不可分割地融合在一起。一方面,人工智能对部分生成式的作品做出了创造性的贡献。另一方面,人类对人工智能生成的最终作品做出了一些创造性的贡献。
在部分生成式作品中,人类对最终作品是否有创造性的贡献,取决于人类是否提供了新的元素,或者对机器中已经存在的元素进行了重新地排列。以人类的输入式创作为例,人工智能在人类的直接指导、帮助或输入下生成新作品,这类作品必须考察人类的贡献是否扰乱了机器的原有计划,即机器对作品的创造性计划不具有完整性。在部分生成式作品中需要确认人类的创造性嵌入作品中的情况,使得创造性的因果关系可以追溯到人类。
在创作过程中使用先进的人工智能系统并不意味着人类将其创作的重要过程都交给了机器,在作品创作过程中,人类可以在作品生成的不同阶段以多种方式做出创造性的选择。例如,在前期的数据筛选,后期的编辑等阶段人类都可能扮演着非常重要的角色。国际保护知识产权协会协会在各国报告的基础上得出人类对于人工智能生成物的干预应该存在于创建人工智能实体以实现特定目标、选择要输入的数据以及创作新作品的阶段。协会在2019年的伦敦大会上发布了《人工智能的版权问题》决议,决议进一步对何为人类干预进行了解释,人类干预指人类参与了输入人工智能的数据或该数据的筛选标准。在决议看来人工智能生成物所具备的独创性产生于生成物形成过程中的人类干预,该独创性应是受版权保护的条件之一。决议认为人工智能生成物只有在其生成过程中人类干预的情况下,且在该生成物符合受保护作品应满足的其他条件的情况下,才能获得版权保护;对于生成过程无人类干预的人工智能生成物,其无法获得版权保护。部分生成式下著作权不会因为人工智能对作品有创造性贡献而取消,作品中的人类因素足以支持作品获得著作权的保护。
完全生成式下,作品的创作完全依赖于人工智能,由人工智能独立创作完成,人类很少或几乎不需要输入就能产生输出,此时人工智能已经具备了一定的自主创作能力,人类参与者都在物理上被移除。AIGC就属于这一类型,AIGC已经不同于传统意义上的钢笔或画笔,甚至不同于照相机,它脱离了惰性工具的范畴,通过自己独立的规则系统创作出一系列作品。例如,GPT-4在各种领域和任务上表现出显著的能力,能够对人类的动机和情感进行理解,其创作出的作品很可能无法跟人类的作品相区分。
完全生成式的一项显著的特点就是作品的创作过程具有不可预见性,产生了人类无法想象的新奇结果,例如,文本、图像或旋律。这一模式下人类将无法对输出结果进行预测,人类往往提供一些关键词或者素材,计算机在机器学习等方式下自动实现创作。深度学习系统中的基于多层神经网络的架构更是加大了用户和机器之间的距离,打破了人类与输出之间的因果关系。人工智能具有了一定程度的自主性和决策能力,一些算法很难进行解释,存在“黑箱”问题,其创作的作品人类无法对其进行清晰解释和预期。在某种意义上讲,人类的创造力来自于将以前没有联系过的想法联系起来的能力。神经网络技术模仿了人类的信息处理活动,它们越来越接近真正的“创造性”半岛综合体育。人工智能可以比任何人更快、在更大的数据池中找到某种关联和相关性,并将其转化为新的文学和艺术作品。
某些情况下在没有人类作者任何创造性输入或干预的情况下人工智能可以随机或自动运行,创作作品的逐渐和摆脱了人类的预测和控制,人类不能再对人工智能的活动或活动的结果施加直接的影响,往往只需要对最终的作品进行筛选,而这相比于AIGC作品的贡献可以忽略。作者已经不能控制表达的过程,其表达是由AIGC的程序控制的,用户既不能控制该机器,也不能系统将创造什么,而人类在作品中的表达是能否得到著作权保护所必须考量的要素。完全生成式作品中人类的劳动在质量上是微不足道的,或者至少在法律上是不充分的,仅仅按下按钮的行为,很难得出人类在作品创作中满足了最低限度的创造性标准,完全不掺杂任何人类创造性的AIGC作品是无法获得著作权保护的。
事实上,英国以及爱尔兰将计算机生成的作品定义为不是由个人而是由计算机生成的可以归为这一类。对于这类作品首先人类不能主张著作权,应为作品中没有人类具体的创造性努力,其次,人工智能也无法主张著作权,因为著作权的主体仅限于人类。最后,程序员或软件供应商也不能主张著作权,正如上文所述程序员或软件供应商已经享有软件的版权保护。因此这类作品将没有人能够成为权利人,作品只能进入公共领域。除非人类付出最小的创造性努力,否则AIGC这类作品就没有保护的必要。
当人工智能应用程序被用于生产时,还需要进一步区分它是仅仅作为人类创造性的工具或手段,还是人类已经放弃了对生产过程及其结果的控制。在Payer Components South Africa Ltd v Bovic Gaskins案中“计算机辅助”和“计算机生成”作品的区分得到了认可。在前一种情况下,计算机只是一种工具,就像笔或文字处理器一样。当计算机被用来辅助人类作者时,即使它“暗示”了表达元素,但过程的控制权仍由作者掌握,此时人类可以干预生成的作品,并能对生成的结果有一定的预测,这时所生成的作品是可以受到著作权保护的。而对于后者,作品的创作是由计算机本身完成的,而人工输入相对较少,这类作品中几乎不存在人类的创造性活动,作品是在没有花费大量人类技能和精力的情况下完成的。作品和人类之间的精神联系是缺失的,因此不具有足够创造性,这类作品无法受到保护。相应的普通工具生成和部分生成式作品可纳入计算机辅助作品的范畴,完全生成式作品则可以纳入计算机生成作品的范畴。
AIGC的发展中,Prompt(提示)成为贯穿内容创作和内容生产的关键步骤,AIGC根据用户提供的文本片段自动完成文本的生成。不同于以往的创作,人类从创作者成了发现者,AIGC的创作过程不仅仅是从有到无,还包括从有中进行筛选和改造。AIGC通过从人类提供的指令中提取和理解意图信息,并根据其知识和意图信息生成内容。以ChatGPT为例,其创作过程通过不断地输入关键词,对生成内容不断试错,然后调整关键词,再对生成的内容进行选择,在一些作品的创作中Prompt甚至会耗费作者的大量精力。Prompt能否认定为创作的关键在于主体是否对最终作品能进行创造性贡献,这些创造性在最终作品上得到了表达,并能被察觉。拉尔夫曾认为判断作品是否具有创造性需要经过三个部分的测试。第一部分为抽象,即寻找作品中的“表达成分”,即作者在作品中表达了什么,作品中包含的“表达成分”是什么。第二部分为确认,即保证作品中某些表达成分源自人类。第三部分为审查,即确定作者是否是有意图地进行了选择,即对于所使用的表达作者是否作出了判断,确定了偏好或得出了结论。不过值得一提的是,创造性是智力创造的标志,对于著作权的保护来说,真正起决定作用的是创造的过程,而不只是之后的表达行为,因此著作权的认定主要是确定在创造过程和表达之间存在可归因的联系。
在AIGC在作品的创作中会涉及两者情况半岛综合体育。一种是相同的输入内容会生成不同的内容。在使用ChatGPT进行自然语言生成时,ChatGPT如同人类一样对输入的内容进行回复,并总结出与给定主题相关的信息,但实际上它是在使用给定的文本来预测和生成后续的单词。这也解释了为什么它的回复并不总是一致的,每次对ChatGPT进行提问,ChatGPT就会使用统计的算法来生成下一个单词,以及后面的单词,因此ChatGPT只是一系列具有概率和权重的选择,这些选择表面上看起来是随机的。ChatGPT在重复测试时不断给出不同的答案,表明了ChatGPT并不知道自己在做什么。ChatGPT每次输出的不同不是由于用户操作的不同,而是由机器设计者的决定。同样用户在AIGC创作过程中使用Prompt来生成图像也不能保证输出的一致性,以图片生成工具Midtravel为例,Midtravel从随机生成的噪音开始,然后演变成最终的图像,所以不能保证特定的提示会生成任何特定的视觉输出,这就像用户将某些术语输入图像搜索引擎,并不能声称搜索时返回的图像是其“创作”的作品一样,无论作品与用户的艺术视觉有多相似。Midtravel生成图片的过程好比创作主体雇用了一位艺术家创作一幅图像,并对其内容进行大致说明,而真正的作者应该是收到这些指示并决定如何最好地表达这些指示的视觉艺术家。另一种情况是,相同的输入内容会生成相同的内容。以谷歌翻译为例,假设用户使用谷歌翻译将文章从英语翻译成中文。用户将文章的文本输入到谷歌翻译网站,谷歌翻译使用复杂的机器学习模型将文本翻译成中文。这一过程中用户只是简单地提供了文本,这一行为对谷歌算法如何将其翻译成中文并未产生任何影响。谷歌翻译算法的程序员负责训练神经网络理解英语和中文,完全控制最终作品的形成过程。两个用户在谷歌翻译中输入相同的文本将会得到相同的结果,这两个用户都无法调整谷歌的算法来创建不同的输出。谷歌翻译并未提供任何参数来供用户修改翻译算法的工作模式,用户也不能要求算法支持特定的措辞或解决方案。
上述两者情况都说明了Prompt并不能控制作品的创作,AIGC程序完全控制了作品的生成,人类已经不能控制表达的过程半岛综合体育,作品并不含有用户的任何创造性表达。用户既不能控制机器,也不能系统将创作什么。在Prompt创作过程中用户不提供任何接近可表达的东西,用户对作品的提示性输入并不意味着对作品的构思或执行施加任何影响,用户并不能决定生成作品的细节,尽管用户可能希望或有创作故事的想法,而计算机程序提供特定的词语、情节、人物和想法的明显“表达”。用户除了按下几个生成键之外,并不享有任何有意义的选择,因此很难识别用户在构思、执行或编辑阶段的任何创造性表达的选择。作品的生成主要依赖于AIGC内部固有元素组成。用户的提示的关键字可能会影响AIGC试图描绘的内容,但指令不会影响机器如何将总体想法转换为最终作品。用户并不制定算法或影响其编码形式的表达,用户更关心的是创作结果,而不是计算机为获得结果而开发的过程。随着AIGC变得更加专业,用户输入的数据会进一步减少,只需非常少的人工输入AIGC就能生成更加复杂的内容。如果AIGC的用户声称他直接参与了最终表达的创作,他必须能够证明他在作品中的投入是实质性的,所以prompt并非真正意义上的“作品创作”。
我国司法实践中已经处理了一些生成作品是否受著作权保护的问题。在北京某律师事务所诉北京某科技有限公司一案(简称“案I”)中原告使用了某先行库自动生成了分析报告。对于该分析报告是否构成作品,法官考察了分析报告的生成过程。虽然原告在报告生成中进行了数据的选择、判断、分析,法院认为原告仅提交了关键词进行搜索,自动生成的分析报告的过程并非传递原告的思想、感情的独创性表达,分析报告是某先行库利用输入的关键词与算法、规则和模板结合形成。法院认为现行法律规定文字作品应由自然人创作完成由于分析报告不是自然人创作的,因此,即使威科先行库“创作”的分析报告具有独创性,某种意义上威科先行库“创作”了该分析报告,该分析报告仍不是著作权法意义上的作品。因此该案中法官通过分析报告不含有用户的创造性表达否定了其可以获得著作权保护的诉求。
与上述案件裁判截然不同的是深圳某计算机系统有限公司诉上海某科技有限公司案(简称“案II”)中。原告使用Dream writer智能写作助手自动撰写了文章。原告发现被告未经原告许可在原告文章发表当日复制了原告涉案文章,并在被告运营的网站通过信息网络向公众传播。法院认为本案中原告主创团队在数据输入、触发条件设定、模板和语料风格的取舍上的安排与选择属于与涉案文章的特定表现形式之间具有直接联系的智力活动。从涉案文章的外在表现形式与生成过程来分析,该文章的特定表现形式及其源于创作者个性化的选择与安排,并由Dream writer软件在技术上“生成”的创作过程均满足著作权法对文字作品的保护条件,应认定涉案文章属于我国著作权法所保护的文字作品。该案中自然人不仅参与了数据输入还参与了模板和语料风格的筛选,自然人对作品地进行了实质性的创造性贡献,此时作品在具备独创性的情况下是能获得著作权的。
由此可以推出我国司法实践否定了单纯的不含用户任何创造性贡献的作品可以受到著作权保护,例如,AIGC作品,其原因就在于用户对作品进行了很少的实质性贡献,或者说创作过程中用户贡献作品的创造性部分很少。在裁判理由上,法院通常会认为目前的著作权法只保护自然人创作的作品,并不保护人工智能作品来否定其著作权。
美国版权局(USCO)对AIGC作品的保护持否定态度,主张人工智能自动生成的作品,不受版权法保护。USCO拒绝为仅由机器或纯粹机械过程随机或自动操作而无需人类作者的任何创造性输入或干预的作品进行版权登记。作品要想获得创造性的资格并能进行登记注册,就必须由人类创作。对于通过Midjourney、Stability AI、ChatGPT等平台自动生成的作品,由于其整个创作过程完全由机器自动完成,因此这类作品无法获得版权法的保护。与之相反通过Photoshop这类软件进行创作生成的图片作品是可以受版权的保护,这是因为这类作品从最初的构思到最终完成的作品,这整个创作过程中,都存在人类的参与。美国最高法院和下级法院的司法先例表明,作品只有由人类作者创作时才能满足版权保护的法律要求,版权法只保护由人类创造性思维产生的智力劳动成果,因此人类作者身份是美国版权保护的先决条件。美国法院将作者作品一词的解释严格限制在人类作者的创作范围内,版权的授予必须存在人类创造力的某些元素,法院旨在保护的是人创作的而不是神创作的作品。任何作品是否有资格受到版权保护,并不取决于其创作中使用的一种或多种工具,而是取决于作品创作时至少有最低限度的人类创造性努力。一件作品要想获得版权,就必须归功于人类,仅由自然、植物或动物生产的材料不可获得版权。对于自然、动物或植物制作的作品,例如,包括“猴子拍摄的照片”“基于被海洋塑造和打磨过的浮木”和“以圣灵为作品作者的歌曲申请”等是无法取得版权的。
在2022年初USCO拒绝为艺术家泰勒(Stephen Thaler)的AIGC作品《通向天堂之近路》(A Recent Entrance to Paradise)画作提供版权保护。拒绝的理由便是作品必须由人类创作,在没有人类作者任何创造性投入或干预,而仅由机器或纯粹机械过程生产的作品是无法获得保护的。USCO将AIGC作品授予版权类比为试图对动物制作的艺术品进行版权的授予。基于同样的理由USCO还取消了艺术家克里斯.卡什塔诺娃(Kris Kashtanova)创作的《黎明的查莉娅》(Zarya of the Dawn)的版权保护。《黎明的查莉娅》是使用合成媒体技术创作的漫画书,该漫画书是在AI Midjourney的帮助下生成的,包括人物、对话等内容。USCO认为对于作品能否取得版权需要对使用的人工智能的程序进行具体的评估,这类人工智能技术用户应该拥有高度控制,并能够预测具体输出,这样才能使人工智能辅助作品受到版权保护。
AIGC的进步使得AIGC作品和人类作品之间的界限变得越来越模糊。目前,很多国家开始修订著作权法以对AIGC作品的著作权问题作出回应。英国、新西兰等国家已将人工智能生成的成果视为版权法保护的客体,日本和美国正在制定人工智能作品的保护规则,瑞士等国则认为目前的法律能够很好地处理人工智能生成作品的著作权问题,因此无需对法律进行修改。虽然著作权法的历史是受保护作品类型逐渐扩大的历史,例如,将计算机程序、电子音乐纳入保护的范围。但如果不加以区分地给予AIGC作品著作权保护可能会引发其他问题,可能会导致算法创作的大规模化,这是因为人工智能的创作能力远远大于人类活动,从而使可能的创作范围饱和。根据香农(Claude Elwood Shannon)的信息理论,每当噪声增加时,错误率就会增加。如果更多可供阅读、收听和观看的新材料质量较差,它就会成为“噪音”的智力等价物,即没有智力转化能力的材料,显著降低了信噪比,并降低了当代人向后代发送的认识论和文化信号的质量。以ChatGPT为代表的AIGC生成作品,其内容虽然看起来或听起来是合理的,但就真实性而言,其内容可能不具有可靠性,特别是深度伪造技术,因此对其给予保护会进一步增加信息“噪音”。
最后对人工智能生成物而言,其是否应该受到保护取决于是否存在人类的创造性贡献,单纯由AIGC生成的作品是无法受到著作权保护的,但如果作品中含有人类的创造性贡献,并在最终的作品中得到了表达,那么是有可能受到著作权保护的。判断作品是否有人类的创造性贡献可以通过对作品的产生过程进行考察。对于人工智能生成作品引入公共领域,不予保护,会不会导致用户或程序所有者隐瞒生产过程中的创造性问题,实际上,对于谎称自己是AIGC作品的情况即虚假署名的情形,可以适用民法有关欺诈的规定或者通过法律制度的设计加以解决。当下对AIGC作品不授予著作权是恰当的,除非计算机真正具备了自主意识,能够真正形成思想并进行表达,人类才需要对AIGC是否授予著作权进行重新地评估,不过那时变革的不仅仅是知识产权领域,整个法律制度都需要作出相应变革。
单小波|生成式人工智能作品的著作权认定原创 单小波上海市法学会 东方法学轻触阅读原文