Meta AI 训练案:作者败诉暴露的版权争议与未来诉讼新策略

1

在人工智能(AI)领域,版权问题一直是备受关注的焦点。最近,一系列涉及AI模型训练的版权诉讼引起了业界的广泛讨论。其中,一起备受瞩目的案件是书 authors 状告 Meta(原 Facebook)侵权一案。然而,该案的判决结果却有些出人意料,法官在判决中指出,书 authors 在案件中提出了错误的论点,导致 Meta 最终胜诉。这一判决引发了关于 AI 训练数据版权问题的更深层次思考。

案件背景

这起案件的核心在于 Meta 使用受版权保护的书籍来训练其 Llama AI 模型。书 authors 认为,Meta 的行为侵犯了他们的版权,并可能对图书市场造成损害。他们提出了两点主要的论点:一是 Llama AI 模型的用户可以复制他们作品中的文本;二是 Meta 的复制行为损害了他们向公司授权版权材料以进行 AI 训练的市场。

然而,法官 Vince Chhabria 认为,这两个论点都存在缺陷。首先,Llama AI 模型无法生成作品的长篇摘录,即使通过对抗性提示也不行。其次,法官认为 authors 无权垄断用于 AI 训练的书籍许可市场。由于 authors 没有提供任何证据表明 Meta 的 AI 技术威胁到他们的市场,法官最终做出了有利于 Meta 的简易判决。

AI快讯

法官的观点

Chhabria 法官在判决中明确表示,该判决并不意味着 Meta 使用受版权保护的材料来训练其语言模型是合法的。他强调,这仅仅是因为 authors 在案件中提出了错误的论点,并且未能提供充分的证据来支持正确的论点。法官甚至批评 authors 对其作品的辩护是“半心半意”的,并指出他的观点“可能与现实存在很大程度的紧张关系”,因为 Llama 确实有可能损害图书销售市场。

尽管如此,Chhabria 法官也为其他书 authors 留下了一线希望。由于 Meta 的简易判决是在集体诉讼认证之前提出的,因此该判决仅适用于本案中的 13 位 authors。这意味着,其他 authors 如果能够提出更有力的证据来证明市场损害,仍然有机会在未来的 Meta 诉讼中胜诉。

AI 训练与市场损害

Chhabria 法官认为,如果权利持有人能够提供市场损害的证据,那么他们最有可能在 AI 版权诉讼中获胜。他指出,即使 AI 训练具有变革性,但使用受版权保护的书籍来开发一种能够创造数十亿甚至数万亿美元的工具,同时还能创造出可能严重损害这些书籍市场的无尽竞争作品,这很难被认为是合理使用。

此外,Chhabria 法官还暗示,某些情况下,针对合理使用的论点可能会更强,例如新闻机构起诉 OpenAI,指控其 ChatGPT 的侵权输出可能间接与其网站竞争。代表《纽约时报》的律师 Ian Crosby 表示,Chhabria 和 Alsup 的判决都加强了《纽约时报》的诉讼。

另一方面,Chhabria 法官认为,如果市场稀释是为了一项明确的公共利益(例如推进国家安全或医学方面的非商业研究)而做出的权衡,那么 AI 公司可能更容易驳倒版权主张。

Meta 的辩护

在本案中,Meta 辩称,如果 authors 胜诉,将会阻止 AI 创新。但 Chhabria 法官对此表示反对,他指出,如果权利持有人在今天的任何一起针对 AI 公司的诉讼中胜诉,唯一的结果是 AI 公司将不得不向 authors 付费,或者依赖公共领域的材料,并证明没有必要使用受版权保护的作品进行 AI 训练。

Chhabria 法官认为,这些产品预计将为开发它们的公司创造数十亿甚至数万亿美元的收入。如果使用受版权保护的作品来训练模型是必要的,那么他们将找到一种方法来补偿版权持有人。

作者的应对策略

Chhabria 法官提出了 authors 可以基于市场损害来对抗 AI 训练的三种途径。首先,他们可以声称 AI 输出“ regurgitate their works”。其次,他们可以“指出授权其作品用于 AI 训练的市场,并声称未经授权的复制用于训练会损害该市场(或阻止该市场的发展)”。第三,他们可以争辩说,AI 输出可以通过生成“基本相似”的作品来“间接替代”他们的作品。

由于前两个论点在 Meta 案中失败了,Chhabria 法官认为“第三个论点对于打算在当前案件中失败的 13 位 authors 之后继续前进的 authors 来说更有希望”。

市场稀释的重要性

Chhabria 法官指出,Meta 曾辩称“市场稀释在第四个因素下并不重要”。但他澄清说,“这不可能是正确的”。他认为,“间接替代仍然是替代”。如果有人购买了由大型语言模型 (LLM) 编写的言情小说,而不是由人类 author 编写的言情小说,那么 LLM 生成的小说将替代人类编写的小说。

Chhabria 法官认为,在许多版权案件中,市场稀释或间接替代的概念并不是特别重要,但 AI 案件可能会改变版权格局,因为它“涉及一种可以生成数百万个 вторичных 作品的技术,而创建原始作品所用的时间和创造力却微乎其微”。

他强调,没有其他用途“具有像 LLM 训练那样有可能以竞争作品充斥市场的潜力。因此,市场稀释的概念变得高度相关……法院不能对一项新技术可能严重损害创作动机的明显方式视而不见,仅仅因为这个问题以前没有出现过”。

对 AI 公司的影响

Chhabria 法官的裁决为希望在先例裁决中推进针对 AI 公司的诉讼的权利持有人提供了一个路线图。对于起诉 Meta 的书 authors 来说,他们在提交给昨日裁决的文件中仅“ fleeting reference”地提到了间接替代,这有些不幸——“法院不能根据他们认为在其他案件中将会或应该发生的事情来裁决案件”。

Chhabria 法官暗示,如果他们的指控再有力一点,他们甚至可以在简易判决中获胜,而不是 Meta。

AI 训练的未来

总的来说,Chhabria 法官的裁决强调了在 AI 训练中使用受版权保护材料所涉及的复杂法律问题。虽然 Meta 在本案中胜诉,但该裁决并不意味着 AI 公司可以随意使用受版权保护的材料进行训练。相反,该裁决强调了权利持有人需要提出强有力的证据来证明市场损害,以便在 AI 版权诉讼中胜诉。

此外,该裁决还表明,市场稀释的概念在 AI 版权案件中可能变得越来越重要。随着 AI 技术的不断发展,法院需要找到一种方法来平衡 AI 创新与保护版权持有人权利之间的关系。这无疑将是一个持续的挑战,需要仔细考虑各种因素,包括 AI 训练的变革性、对市场的影响以及公共利益。

结论

书 authors 与 Meta 的案件虽然以 authors 的失败告终,但它揭示了 AI 训练领域版权问题的复杂性和重要性。未来的类似案件中,authors 需要更加注重市场损害的举证,并充分利用诸如“市场稀释”等概念。同时,AI 公司也需要认真对待版权问题,探索更加合规的数据获取和使用方式。只有这样,才能在促进 AI 技术发展的同时,保障创作者的合法权益,实现创新与保护的平衡。