在人工智能(AI)领域,版权问题一直备受争议。最近,一起涉及Meta的AI训练案件再次引发了广泛关注。法官在判决中指出,图书作者在Meta AI训练案件中提出了错误的论点,这使得Meta在一定程度上获得了胜利。然而,这场胜利并非绝对,法官之间的意见分歧也预示着未来AI公司可能面临更多的挑战。
案件回顾:图书作者的“失误”
事情的起因是Meta利用受版权保护的图书来训练其人工智能模型。图书作者对此表示不满,并提起了诉讼。然而,法官Vince Chhabria在审理此案后表示,尽管他个人可能对Meta的行为持保留态度,但由于作者在案件中提出了错误的论点,他不得不做出对Meta有利的判决。
Chhabria法官明确指出,他的判决并不意味着Meta使用受版权保护的材料来训练其语言模型是合法的。相反,这仅仅是因为原告未能提出正确的论点,也未能提供足够的支持证据。作者的论点主要集中在两个方面:一是Meta的Llama AI模型可能大量复制其作品,从而间接损害销售;二是作者有权垄断许可图书用于AI训练的市场。然而,Chhabria法官认为这两种理论都存在缺陷。Llama无法生成作品的长篇节选,即使在受到对抗性提示时也是如此。此外,作者无权垄断许可图书用于AI训练的市场。
由于作者未能提供Meta的AI威胁到其市场的证据,Chhabria法官裁定Meta仅需提供“其自身的专家证词,解释Llama 3的发布对原告的销售没有任何明显影响”,就足以克服作者关于所谓损害的其他论点。Chhabria法官似乎批评作者对其作品的辩护“半心半意”,并指出他的观点“可能与现实存在显著冲突”,即Llama可能会损害图书销售市场。
一线曙光:其他作者的机会
尽管如此,对于其他图书作者来说,这项裁决中可能存在一线希望。由于Meta的简易判决请求是在本案中进行集体认证之前提出的,因此他的裁决仅适用于在本案中起诉Meta的13位作者。这意味着其他作者如果能够提出更有力的理由,指控市场受到损害,那么他们仍然有很大的机会在未来的Meta诉讼中胜诉。Chhabria法官写道:“在涉及像Meta这样的使用案例中,原告通常会胜诉,至少在那些案件中,被告使用的市场影响有更完善的记录。”
Chhabria法官认为,无论人工智能训练具有何种变革性,使用受版权保护的图书来开发一种能够创造数十亿甚至数万亿美元的工具,同时还能创造出可能严重损害这些图书市场的潜在无休止的竞争作品流,这很难说是合理使用。此外,Chhabria法官表示,“有些案件可能会提出更有力的反对合理使用的论点”,例如新闻机构起诉OpenAI,指控ChatGPT的侵权输出可能间接与其网站竞争。代表《纽约时报》提起诉讼的律师伊恩·克罗斯比告诉Ars,庆祝该裁决,Chhabria和Alsup的裁决都被视为加强了《纽约时报》的案件。
克罗斯比说:“这两项裁决表明了我们长期以来的观点:生成式人工智能开发商不得通过复制被盗的新闻内容来构建产品,尤其是在通过不正当手段获取内容且其产品输出替代内容,从而威胁到原始的人工新闻市场的情况下。”另一方面,Chhabria法官写道,如果担心的市场稀释是为了明确的公共利益(例如推进对国家安全或医学的非商业研究)而进行的权衡,那么人工智能公司可能会更容易击败版权主张。
关键分歧:AI训练与“学童”类比
Chhabria法官明确指出,如果权利持有人提供市场稀释的证据,这可能会引发最强烈的反对,最有可能赢得AI版权争夺战。因此,尽管Meta在技术上赢得了与这些图书作者的这场斗争,但该裁决对Meta来说不一定是轻而易举的,也不能为任何AI公司提供充分的保障。Chhabria法官表示,案件的胜负将取决于对市场损害的指控,而不是基于其产品对作者作品的“变革性”使用。
他声称,他的裁决的“结果”是他没有创建任何明确的规则来为AI公司开辟例外。相反,他认为他的裁决清楚地表明,“在许多情况下,未经许可复制受版权保护的作品来训练生成式AI模型将是非法的。这意味着,为避免承担版权侵权责任,这些公司通常需要向版权持有人支付使用其材料的权利。”
在他的命令中,Chhabria法官批评了威廉·阿尔苏普法官在本周Anthropic案中的裁决,即“严重依赖生成式人工智能的变革性,同时对它可能对受过训练的作品市场造成的损害不予理睬”。Chhabria特别不赞成Alsup将作者对Anthropic的Claude淹没图书市场可能造成的市场损害的抱怨与“教小学生写好”会“导致竞争作品爆炸式增长”的古怪想法进行比较。
“根据阿尔苏普法官的说法,这‘不是版权法所关心的那种竞争或创造性替代’,”Chhabria写道。“但是,当涉及到市场影响时,使用图书教孩子写作与使用图书创建一种产品,让一个人可以用来生成无数竞争作品,而只需花费一小部分的时间和创造力,这根本不像。”“这种不恰当的类比不是忽略合理使用分析中最重要因素的基础,”Chhabria警告说。
此外,Meta声称授予作者胜利将阻止AI创新“在其轨道上”是“荒谬的”,Chhabria写道,并指出,如果权利持有人在当今针对AI公司的任何诉讼中获胜,唯一的结果是AI公司将不得不向作者付款——否则依赖公共领域的材料并证明根本没有必要使用受版权保护的作品进行AI训练。
Chhabria写道:“预计这些产品将为开发它们的公司带来数十亿甚至数万亿美元的收入。如果使用受版权保护的作品来训练模型是公司所说的那么必要,他们将找到一种方法来补偿版权持有人。”
作者的未来之路:三大策略
本周的裁决表明,人工智能训练是否具有变革性的问题已基本解决。但是,随着作者继续起诉AI公司,Chhabria法官建议“通常原告击败合理使用的唯一机会将是果断地赢得”公平使用分析的第四个因素,即法官和陪审团权衡“使用对受版权保护作品的潜在市场或价值的影响”。
Chhabria法官建议,作者至少可以通过三种途径来对抗基于市场损害的AI训练。首先,他们可以声称AI输出“会反刍他们的作品”。其次,他们可以“指出许可其作品用于AI训练的市场,并声称未经授权的复制用于训练会损害该市场(或阻止该市场的发展)”。第三,他们可以争辩说,AI输出可以通过生成“基本相似”的作品来“间接替代”他们的作品。
由于前两个论点在Meta案中失败了,Chhabria认为“第三个论点对”打算在当前案件中13位作者失败的地方接过接力棒的作者“更有希望”。Chhabria指出,可能阻止作者在Meta案中援引市场稀释作为威胁的一个有趣的细节是,Meta辩称“市场稀释在第四个因素下不重要”。但Chhabria澄清说“那不可能是对的”。
Chhabria写道:“间接替代仍然是替代。如果有人购买了由[大型语言模型(LLM)]撰写的浪漫小说,而不是由人类作家撰写的浪漫小说,那么LLM生成的浪漫小说将替代人类撰写的浪漫小说。”他建议,人工智能生成的非小说类书籍也是如此。因此,虽然“在许多版权案件中,这种市场稀释或间接替代的概念并不是特别重要”,但AI案件可能会改变版权格局,因为它“涉及一种可以生成数百万个辅助作品的技术,而只需花费一小部分的时间和创造力来创建用于训练的原始作品”,Chhabria写道。
Chhabria认为,这是前所未有的,因为没有其他用途“具有像LLM训练那样有可能用竞争作品淹没市场的潜力。因此,市场稀释的概念变得高度相关......法院不能对新技术可能严重损害创造动机的明显方式视而不见,仅仅因为这个问题以前没有出现过。”
在某种程度上,Chhabria的裁决为希望在具有里程碑意义的裁决中推进针对AI公司的诉讼的权利持有人提供了一个路线图。不幸的是,对于起诉Meta的图书作者来说,他们在Chhabria找到了一位同情法官——但在昨天裁决之前的备案文件中,仅在单一报告中“一闪而过地提到了间接替代”——“法院不能根据他们认为在其他案件中将会或应该发生的事情来裁决案件”。
Chhabria表示,如果他们的指控再有力一点,他们甚至可以在简易判决中获胜,而不是Meta。“事实上,似乎市场稀释通常会导致原告果断地赢得第四个因素——从而赢得整体合理使用问题——在像这样的案件中,”Chhabria写道。
总结
Meta在AI版权案件中取得的胜利并非终点,而是一个新的起点。法官的判决为未来的版权诉讼提供了新的方向,同时也提醒AI公司,合规经营才是长久之道。作者们如果能够充分利用市场损害这一论点,将有机会在未来的诉讼中获得胜利。而对于整个AI行业来说,如何在创新与版权保护之间找到平衡,将是一个永恒的议题。