AI训练新规:合法书籍可用于LLM,盗版零容忍

0

在人工智能领域,关于使用受版权保护书籍进行AI模型训练的合理使用界限问题,一直备受争议。近日,美国地区法官威廉·阿尔苏普的一项具有里程碑意义的裁决,为这一问题带来了新的曙光。该裁决明确指出,人工智能公司在合法获取书籍的前提下,无需获得作者的许可,即可使用这些书籍训练其大型语言模型(LLM)。

这项开创性的裁决被广泛认为是AI公司的一大胜利,它为AI训练的合理使用开了绿灯。然而,裁决也明确警告那些期望将这一原则应用于盗版书籍训练的AI公司,此类行为的合法性仍有待商榷。

阿尔苏普法官在审理一起图书作者起诉Anthropic公司的案件中,明确指出,使用受版权保护的作品来训练LLM,以生成新的文本,本质上是一种具有变革意义的行为,并且对于构建世界一流的AI模型至关重要。他强调,此案与作者指控AI模型复制和传播其作品的其他诉讼不同。原告作者并未声称Anthropic的任何输出内容复制了他们的作品或表达风格,因此,阿尔苏普法官认为,Anthropic的文本生成器Claude不太可能取代作者在市场中的地位。正是由于缺乏这种替代风险的论证,才使得合理使用分析的天平向Anthropic倾斜。

阿尔苏普法官以生动的比喻写道:“就像任何渴望成为作家的读者一样,Anthropic的LLM接受作品训练的目的并非为了赶超、复制或取代这些作品,而是为了实现一次彻底的转变,创造出截然不同的东西。”

这一裁决无疑让那些认为Claude依赖其文本可能生成具有竞争力的摘要或替代版本故事的作者感到失望。法官驳斥了他们的担忧,认为这类似于争辩说“训练学童写作会导致大量竞争作品的涌现”。

Ars视频

阿尔苏普法官进一步解释说:“这并非版权法所关注的那种竞争性或创造性取代。该法旨在促进原创作品的创作,而非保护作者免受竞争。”

法官同时指出,如果作者发现Claude输出了侵权内容,他们可以提出新的诉讼。这种情况可能会改变合理使用的考量,正如最近一位法官暗示Meta的AI产品可能正在“摧毁”作者作品市场的那起案件一样。

阿尔苏普法官写道:“作者承认,训练LLM并未导致向公众提供其作品的任何精确副本,甚至没有侵权的仿制品。如果情况并非如此,这将是另一起案件。如果未来出现此类事实,作者可以自由提起诉讼。”

Anthropic必须面对图书盗版审判

Anthropic公司对这一裁决表示“满意”,并发表声明赞扬法院承认“使用作品训练LLM具有变革性——而且是引人注目的”。

尽管获得了AI训练合理使用的初步胜利,Anthropic公司仍面临图书盗版审判。阿尔苏普法官裁定,盗版行为不支持合理使用。

在该案件中,Anthropic公司被指控下载了700万本盗版书籍,以建立一个研究图书馆,无论这些书籍是否用于AI训练,都会“永久”保存副本。

Anthropic公司似乎意识到盗版可能引发法律挑战,后来试图用合法购买的副本替换盗版书籍。但该公司同时辩称,即使最初复制这些盗版书籍也是推进AI训练这一变革性用途所必需的“中间”步骤。Anthropic公司还提出,由于它可以借阅其盗用的书籍,因此盗窃行为本身不应“中断”合理使用分析,但这一论点并未获得法官的认可。

阿尔苏普法官驳斥了这些论点,指出从盗版网站复制书籍是侵犯版权的行为,“毫无疑问”。他驳斥了“Anthropic公司认为,仅仅因为某些副本最终将用于训练LLM,就可以将使用中央图书馆的副本的行为视为合理使用”的观点,并对其他正在讨论盗版行为的AI诉讼能否免于支付赔偿金表示怀疑。

阿尔苏普法官写道:“本命令怀疑,任何被指控的侵权者都能解释为什么从海盗网站下载其本可以购买或以其他方式合法访问的源副本,对于任何后续的合理使用都是合理必要的。” “即使盗版副本立即用于变革性用途并立即丢弃,这种对原本可用的副本的盗版行为本质上也是不可挽回的侵权行为。”

但阿尔苏普法官表示,Anthropic公司的案件甚至可能不需要对此做出决定,因为Anthropic公司保留盗版书籍用于其研究图书馆本身并不具有变革性。阿尔苏普法官写道,Anthropic公司辩称,保留其盗版的潜在AI训练材料以备将来决定用于AI训练,是一种试图“快速滑过薄冰”的行为。

此外,阿尔苏普法官指出,Anthropic公司早期获得授权以训练作者作品的尝试失败了,内部消息显示,该公司认为窃取书籍是更具成本效益的创新途径,“以避免‘法律/实践/业务上的困境’,正如联合创始人兼首席执行官Dario Amodei所说的那样。”

阿尔苏普法官写道:“Anthropic公司认为,只要你创造出一个令人兴奋的最终产品,每一个‘公众看不见的后端步骤’都会被原谅,这是错误的。” “在这里,盗版是关键:建立一个本可以付费的中央图书馆,就像Anthropic公司后来做的那样,但无需为此付费。”

阿尔苏普法官的命令表明,为了避免在败诉时遭受最大程度的损害,Anthropic公司可能会继续辩称,用购买的书籍替换盗版书籍应该会削弱作者的斗争。

阿尔苏普法官指出:“Anthropic公司后来购买了其早期从互联网上窃取的书籍的副本,这不会免除其盗窃责任,但可能会影响法定赔偿金的数额。”