Meta AI训练案：版权争议与市场稀释的新焦点

在人工智能（AI）领域，版权问题一直是备受争议的焦点。最近，一起涉及Meta（前身为Facebook）的AI训练案例引起了广泛关注。法官在审理此案时，对图书作者提出的论点表示质疑，认为他们没有充分论证Meta的AI模型对其市场造成的潜在危害。这一判决引发了业界对于AI训练与版权保护之间平衡的深刻思考。

法官的质疑与判决

此案的核心在于，图书作者指控Meta使用其受版权保护的作品来训练AI模型，侵犯了他们的权益。然而，法官Vince Chhabria在判决中指出，作者们未能提供充分的证据来证明Meta的AI模型Llama对其市场造成了实际的损害。法官认为，作者们主要提出了两个论点：一是Llama模型可以复制其作品的文本，二是Meta的复制行为损害了他们向公司授权版权材料以进行AI训练的市场。但是，法官认为这两个论点都存在缺陷。

首先，法官认为Llama模型无法生成作品的长篇摘录，即使通过对抗性提示也不行。其次，法官认为作者无权垄断用于AI训练的图书许可市场。由于作者未能提供Meta的AI威胁到其市场份额的证据，法官裁定Meta已充分克服了作者关于所谓损害的其他论点，仅提供了“其自己的专家证词，解释说Llama 3的发布对原告的销售没有任何明显影响”。

AI快讯

法官Chhabria似乎批评作者对其作品的辩护“半心半意”，并指出他的意见“可能与现实存在重大冲突”，在这种情况下，“Llama可能会损害图书销售市场，即使是很可能”。

法官Chhabria表示，这一裁决并不意味着Meta使用受版权保护的材料来训练其语言模型是合法的。他强调，这仅仅是因为原告提出了错误的论点，并且未能建立一个支持正确论点的记录。换句话说，法官认为作者们没有充分论证Meta的AI模型对其市场造成的潜在危害，因此无法支持他们的诉讼请求。

潜在的市场危害

尽管法官做出了有利于Meta的判决，但他同时也暗示，如果作者能够提供更充分的证据，证明Meta的AI模型对其市场造成了实际的损害，那么他们可能会赢得诉讼。法官指出，AI模型可能会生成大量与作者作品竞争的内容，从而稀释市场，降低作者的收益。这种市场稀释效应可能会对作者的创作积极性产生负面影响，进而影响整个图书行业的创新。

Chhabria认为，如果权利持有人提供市场稀释的证据，这可能会引起最强烈的反对，最有可能赢得AI版权争夺战。因此，虽然Meta在与这些图书作者的斗争中在技术上获胜，但该裁决并不一定对Meta有利，也不能为任何AI公司提供充分的保障。

法官以新闻机构起诉OpenAI为例，认为OpenAI涉嫌侵犯ChatGPT的输出，可能间接与其网站竞争，在这些案例中，针对合理使用的争论可能会更加强烈。代理《纽约时报》提起诉讼的律师伊恩·克罗斯比在庆祝这一裁决时告诉Ars，Chhabria和Alsup的裁决都被视为加强了《纽约时报》的理由。

克罗斯比说：“这两项裁决表明了我们长期以来的论点：生成式人工智能开发者不得通过复制被盗的新闻内容来构建产品，尤其是在通过不正当手段获取内容且其产品输出替代内容，从而威胁到原创的人工制作的新闻业市场的情况下。”

另一方面，Chhabria写道，如果人们担心市场稀释是为了清晰的公共利益而进行的权衡，例如推进对国家安全或医学的非商业研究，那么AI公司可能会更容易驳回版权主张。

Chhabria表示，如果作者引入任何市场稀释的证据，Meta就不会在此案的这个阶段胜诉，并且可能会在陪审团权衡的集体诉讼中面临更广泛的调查。

相反，本案中唯一幸存的主张涉及Meta有争议的图书 torrenting，以训练 Llama，作者迄今为止已成功声称这可能通过分发他们的作品作为 torrenting 过程的一部分而违反了版权法。

AI训练与“学童”类比

在判决中，法官Chhabria还对另一位法官William Alsup的观点提出了异议。Alsup法官在另一起涉及Anthropic的案件中，将AI训练比作教育“学童”，认为这是一种具有变革性的行为，不应受到版权法的限制。Chhabria法官对此表示强烈反对，认为这种类比是不恰当的。

Chhabria特别不赞成 Alsup 将作者抱怨 Anthropic 的 Claude 可能会涌入图书市场而造成的可能市场危害与教授“学童写作”会“导致竞争作品爆炸式增长”的古怪想法进行比较。

“根据 Alsup 法官的说法，这“不是版权法所关注的那种竞争或创造性替代”，”Chhabria 写道。“但是，当涉及到市场影响时，使用书籍教孩子写作与使用书籍创造一种产品来让一个人可以用来生成无数的竞争作品，而只需花费一小部分时间和创造力，这与此无关。”

“这种不恰当的类比并不是忽略合理使用分析中最重要因素的基础，”Chhabria 警告说。

Chhabria认为，使用书籍教育儿童与使用书籍训练AI模型是完全不同的。教育儿童是为了培养他们的创造力和表达能力，而AI模型则是为了生成与原始作品竞争的内容。这种竞争可能会对作者的市场造成直接的损害，因此不能简单地将其视为一种“创造性替代”。

此外，Meta声称，如果授予作者胜诉权，将阻止人工智能创新，“这是荒谬的”，Chhabria 写道，并指出，如果权利持有者在今天针对人工智能公司的任何诉讼中胜诉，唯一的结果是人工智能公司将不得不向作者付款——或者依赖公共领域的材料，并证明根本没有必要使用受版权保护的作品进行人工智能训练。

“预计这些产品将为开发它们的公司带来数十亿甚至数万亿美元的收入，”Chhabria 写道。“如果使用受版权保护的作品来训练模型是公司所说的那么必要，他们将找到一种方法来补偿版权持有者。”

作者的应对策略

面对AI公司对版权的挑战，作者们需要采取更加积极的应对策略。法官Chhabria提出了三条建议，帮助作者在未来的诉讼中更好地保护自己的权益：

证明AI输出“复制”其作品：作者可以尝试证明AI模型生成的输出内容与其原始作品高度相似，构成了版权侵权。
指出许可其作品用于AI训练的市场，并辩称未经授权的复制会损害该市场（或阻止该市场的发展）：作者可以强调其作品在AI训练领域的潜在价值，并指出未经授权的复制行为损害了这一市场。
论证AI输出可能通过生成“基本相似”的作品来“间接替代”其作品：作者可以证明AI模型生成的输出内容与其原始作品在功能和用途上相似，构成了市场替代。

由于前两个论点在 Meta 案中均未奏效，Chhabria 认为“第三个论点对于打算在当前案件中 13 位作者失败的地方继续努力的作者来说更有希望”。

一个有趣的难题可能是阻止作者在 Meta 案中援引市场稀释作为威胁，Chhabria 指出 Meta 辩称“市场稀释在第四个因素下不算数”。

但 Chhabria 澄清说“这不可能是正确的”。

“间接替代仍然是替代，”Chhabria 写道。“如果有人购买了[大型语言模型 (LLM)]编写的言情小说，而不是人类作者编写的言情小说，那么 LLM 生成的小说将替代人类编写的小说。”他暗示，人工智能生成的非小说类书籍也是如此。

因此，虽然“在许多版权案件中，这种市场稀释或间接替代的概念并不是特别重要”，但人工智能案件可能会改变版权格局，因为它“涉及一种可以生成数百万种二次作品的技术，而只需花费一小部分时间和创造力来创建用于训练它的原始作品”，Chhabria 写道。

Chhabria 认为，这是前所未有的，因为没有其他用途“具有像 LLM 训练那样有可能用竞争作品淹没市场的潜力。因此，市场稀释的概念变得高度相关......法院不能将头埋在沙子里，而看不到一种新技术可能会严重损害创造激励的明显方式，仅仅是因为这个问题以前没有出现过。”

在某种程度上，Chhabria 的裁决为希望在具有里程碑意义的裁决中推进针对人工智能公司的诉讼的权利持有人提供了一个路线图。

不幸的是，对于起诉 Meta 的图书作者来说，他们在 Chhabria 找到了一位有同情心的法官——但只是在昨天裁决之前的文件中“一闪而过地提及”了单一报告中的间接替代——“法院不能根据他们认为将在其他案件中发生或应该发生的事情来裁决案件。”

如果他们的指控再有力一点，Chhabria 建议他们甚至可以在简易判决中胜诉，而不是 Meta。

“事实上，在这样的案件中，市场稀释很可能经常导致原告在第四个因素上取得决定性的胜利——从而赢得整体公平使用问题，”Chhabria 写道。

总而言之，Meta AI训练案例引发了关于AI发展与版权保护之间平衡的重要讨论。法官的判决强调了作者在提起版权诉讼时需要提供充分的证据，同时也为作者们指明了未来的应对方向。随着AI技术的不断发展，我们有必要在保护创新与尊重版权之间找到一个合理的平衡点，以促进整个行业的健康发展。

Meta AI训练案：版权争议与市场稀释的新焦点

法官的质疑与判决

潜在的市场危害

AI训练与“学童”类比

作者的应对策略

结论