Meta AI 训练案:市场影响成版权诉讼胜负手?

1

Book authors and publishing professionals staged a protest outside Meta UK offices in King's Cross over the Facebook owner's use of copyrighted books to train artificial intelligence

在人工智能(AI)领域,版权问题一直是备受关注的焦点。近日,Meta 公司在 AI 模型训练中涉及的版权诉讼案再次引发了业界对 AI 技术发展与知识产权保护之间平衡的深入思考。美国地方法院法官 Vince Chhabria 在审理一起图书作者起诉 Meta 的案件中指出,尽管他最终做出了有利于 Meta 的判决,但这并不意味着 Meta 可以随意使用受版权保护的材料来训练其 AI 模型。Chhabria 强调,该判决仅仅是因为原告作者在案件中提出了错误的论点,未能充分证明 Meta 的行为对其市场造成了实际损害。

案件背景

此案与此前 Anthropic 公司被诉未经授权复制图书用于 AI 模型训练的案件类似。在 Anthropic 案中,法官认为 Anthropic 的行为构成了“转化性”的合理使用。然而,Chhabria 法官在 Meta 案中表达了不同的观点,他认为作者未能提供充分的证据来支持其论点,导致法庭不得不做出对 Meta 有利的判决。

法官的质疑与批评

Chhabria 法官对原告作者的辩护策略提出了严厉批评。作者们主要关注的是 Meta 的 Llama AI 模型是否能够复制其作品的文本,以及 Meta 的复制行为是否损害了其向 AI 公司授权版权材料的市场。法官认为,Llama 模型无法生成长篇的作品摘录,而且作者无权垄断 AI 训练书籍的许可市场。更重要的是,作者未能提供任何证据表明 Meta 的 AI 技术威胁到他们的市场,从而导致其论点缺乏说服力。

Chhabria 法官甚至批评作者对自己的作品进行了“半心半意的”辩护,并指出他的意见可能与现实存在冲突。他认为,Llama 模型很可能对图书销售市场造成损害。然而,由于作者未能提供充分的证据,法庭只能根据 Meta 提供的专家证词做出判决,即 Llama 3 的发布对原告的销售没有产生明显的影响。

案件的潜在影响

尽管 Meta 在此案中胜诉,但 Chhabria 法官的判决也为其他图书作者提起类似的诉讼提供了一线希望。由于 Meta 的简易判决请求是在集体诉讼认证之前提出的,因此该判决仅适用于本案中的 13 位原告作者。这意味着,其他作者如果能够提出更强有力的证据,证明 Meta 的行为对其市场造成了损害,仍然有可能在未来的诉讼中获胜。

Chhabria 法官明确指出,如果原告能够证明 Meta 的 AI 技术威胁到他们的市场,那么他们很可能会胜诉。他强调,即使 AI 训练具有“转化性”,也不能成为 AI 公司利用受版权保护的图书来开发价值数十亿甚至数万亿美元的工具的理由,尤其是在这种工具可能产生大量与原作品竞争的作品,从而严重损害图书市场的情况下。

市场稀释与版权保护

Chhabria 法官特别强调了市场稀释的概念。他指出,如果有人购买了由大型语言模型(LLM)生成的言情小说,而不是由人类作者创作的言情小说,那么 LLM 生成的小说就取代了人类创作的小说。他认为,AI 技术有潜力产生数百万部衍生作品,而这些作品的创作时间和创造力成本远低于原始作品。这种前所未有的情况使得市场稀释成为一个高度相关的问题。

Chhabria 法官警告说,法院不能对新技术可能严重损害创作激励的明显方式视而不见,仅仅因为这个问题以前没有出现过。他认为,如果版权所有者能够提供市场稀释的证据,那么他们最有可能在 AI 版权诉讼中获胜。

与其他判决的对比

Chhabria 法官还批评了 William Alsup 法官在 Anthropic 案中的判决,认为 Alsup 过分强调了生成式 AI 的转化性,而忽视了其可能对市场造成的损害。Chhabria 特别反对 Alsup 将作者对市场损害的担忧与“教小学生写作”进行比较,认为这种类比并不恰当。他指出,利用图书教孩子写作与利用图书创造一种可以生成无数竞争作品的产品之间存在本质区别。

作者的反击之路

Chhabria 法官的判决为版权所有者提供了在 AI 诉讼中取得成功的三个途径:

  1. 证明 AI 输出会“复制”他们的作品。
  2. 指出 AI 训练作品许可市场的存在,并声称未经授权的复制会损害该市场。
  3. 论证 AI 输出可以通过生成“基本相似”的作品来“间接替代”他们的作品。

Chhabria 认为,由于前两个论点在 Meta 案中失败,因此第三个论点对于希望继续战斗的作者来说更有希望。他明确表示,市场稀释仍然是一种替代形式,不应被忽视。

AI 公司的责任

Chhabria 法官驳斥了 Meta 的说法,即如果作者胜诉,AI 创新将会“停止”。他指出,如果版权所有者在任何针对 AI 公司的诉讼中获胜,唯一的结果是 AI 公司将不得不向作者支付报酬,或者依靠公共领域的材料,并证明没有必要使用受版权保护的作品进行 AI 训练。他强调,这些产品预计将为开发它们的公司带来数十亿甚至数万亿美元的收入,如果使用受版权保护的作品来训练模型是必要的,那么这些公司将找到一种方法来补偿版权所有者。

结论

Meta AI 训练案的判决结果虽然对 Meta 有利,但同时也为未来的 AI 版权诉讼指明了方向。Chhabria 法官的判决强调了市场影响在判断 AI 模型训练是否构成合理使用时的重要性。对于那些希望维护自身版权的作者来说,他们需要提供充分的证据来证明 AI 技术的应用对其市场造成了实际损害。只有这样,他们才能在与 AI 巨头的法律博弈中占据更有利的位置。

随着 AI 技术的不断发展,版权保护问题将变得越来越复杂。我们需要在鼓励技术创新的同时,也要充分保障知识产权所有者的合法权益。只有这样,才能实现 AI 技术与文化产业的和谐发展,共同繁荣。

未来的 AI 发展中,如何在合规的框架下利用数据,平衡技术发展与版权保护,将是所有参与者需要共同面对和解决的问题。