Meta的AI版权诉讼：Torrenting风波与行业未来

在人工智能（AI）领域，版权问题一直备受关注。最近，Meta公司与一群作家之间的版权诉讼案有了新的进展，案件的核心在于Meta是否通过非法 torrenting（BT下载）获取书籍来训练其AI模型。本文将深入探讨这一案件的细节，分析其中涉及的法律问题，并展望AI版权领域的未来趋势。

案件背景

此案由包括喜剧演员莎拉·西尔弗曼和普利策奖得主朱诺·迪亚兹在内的13位作家提起，他们指控Meta在训练其Llama AI模型时，未经授权使用了他们的作品。虽然Meta在很大程度上驳回了原告提出的AI训练版权侵权诉讼，但还有一个悬而未决的问题：Meta是否通过torrenting非法获取书籍。

美国地方法院法官文斯·查布里亚发布了一项命令，部分批准了Meta的即决判决动议。命令中指出，Meta与原告将于7月11日会面，讨论Meta在torrenting过程中是否非法传播了原告受版权保护的作品。法官同时暗示，由于缺乏证据，作者可能难以在这部分诉讼中胜诉，因为这个问题是在案件后期提出的，尚未进行充分的调查取证。

Torrenting的潜在影响

法官查布里亚认为，Meta的torrenting行为并非完全“无关紧要”，至少在以下几个方面具有潜在关联性：

恶意: Meta从shadow libraries（影子图书馆，通常指提供盗版资源的在线平台）下载书籍的行为，可能被视为一种恶意行为。这与合理使用分析的首要因素——使用的性质有关。

原告方声称，Meta曾与一些出版商讨论过授权事宜，但在未能获得授权后，首席执行官马克·扎克伯格“升级”了这个问题。查布里亚法官写道，这促使Meta决定从盗版图书馆获取书籍，并且承认在使用BitTorrent下载数据之前，已经放弃了为这些书籍寻求许可协议。

然而，审判的这一方面可能并不重要，因为查布里亚法官指出，“关于恶意是否与合理使用相关的法律尚不明确。”
对盗版图书馆的经济支持: 如果Meta从shadow libraries下载受版权保护的材料，从而使这些图书馆的创建者受益，并支持和延续他们未经授权复制和传播受版权保护作品的行为，那么这也将与使用的性质相关。

查布里亚法官指出，大多数涉及“这种点对点文件共享”的案件都被认定为“构成版权侵权”。此外，Meta使用的某些shadow libraries本身已被判侵权，这对Meta不利。

然而，Meta可能也会克服这一论点，因为原告方“没有提交任何证据”表明Meta的下载行为可能以某种方式“支持”或在经济上使盗版图书馆受益。
与AI模型训练的关系: 法官认为，Meta下载原告书籍的行为与其使用这些书籍训练Llama模型之间存在关联。

原告试图辩称这些要素是截然不同的。但查布里亚法官表示，Meta下载书籍是为了服务于训练Llama这一“高度变革性”的目的，因此不能将两者割裂开来。

法官写道：“因为Meta最终对原告书籍的使用具有变革性，所以Meta下载这些书籍的行为也同样具有变革性。”

AI训练判决可能使更多作者获得报酬

作者们只是通过诉讼中的调查才了解到Meta的torrenting行为，因此，查布里亚法官指出，“关于Meta所谓传播行为的记录是不完整的。”

查布里亚法官在一份脚注中表示，作者或许能够提供证据表明，Meta通过提供强大的计算能力，“为BitTorrent网络做出了贡献”，从而对shadow libraries 提供了有意义的帮助。然而，查布里亚批评作者们只引用了一篇过时的Ars Technica文章（2010年），该文章表明人们很少使用BT下载盗版书籍。但TorrentFreak在最近的报告中记录到，自那时以来，电子书盗版现象已显著增加。

随着Meta案件在下个月取得进展，更多信息将会披露。但查布里亚法官指出，无论作者胜诉与否，一个潜在的结果可能是，出版商将更有动力让作者更容易地授权他们的作品用于AI训练。

查布里亚法官写道：“出版商目前可能并不持有进行集体授权所需的子公司权利。但是，很难相信他们不会很快开始与作者谈判这些权利，以便他们能够与大型语言模型（LLM）开发者进行大规模的谈判和授权”，假设他们尚未开始这样做。

“如果大型语言模型开发者的唯一选择是获得许可或放弃使用受版权保护的书籍作为训练数据，那么这些许可市场似乎特别有可能出现，”查布里亚法官指出。

如果其他起诉AI公司的作者获得查布里亚法官认为不可避免的胜利，那么可能会出现这样的结果。他们需要证明AI产品会稀释其作品的市场，而起诉Meta的作者未能做到这一点。

在裁决中，查布里亚法官认为作者提出了“错误的论点”，Meta才赢得了针对作者版权侵权主张的胜利，这意味着如果提出更有力的版权诉讼，Meta将来可能更倾向于恢复授权谈判。因此，如果面临这种潜在现实的AI公司“选择仅使用公共领域作品作为训练数据（而不是授权受版权保护的作品），那将表明他们实际上并不像他们声称的那样需要受版权保护的作品”，查布里亚法官写道。如果真是这样，那么作者长期以来认为的明显侵犯版权的盗版书籍就没有什么借口了。

法律分析

此案涉及多个复杂的法律问题：

合理使用: Meta辩称其使用书籍是为了训练AI模型，这是一种“变革性”用途，可能构成合理使用。然而，法院需要评估Meta使用的性质、目的、数量以及对原告作品市场的影响等因素。
间接侵权: 如果Meta的行为间接促成了盗版图书馆的侵权行为，例如通过提供经济支持或技术帮助，那么Meta可能承担间接侵权责任。
恶意: Meta在寻求授权失败后，转而使用盗版资源，这可能表明其行为具有恶意，从而削弱其合理使用的辩护。

行业影响

此案的结果可能对AI行业产生深远影响：

技术创新: AI公司可能会探索新的技术方法，以减少对受版权保护数据的依赖，例如使用合成数据或公共领域数据进行训练。
法律监管: 各国政府可能会加强对AI版权问题的监管，制定更明确的法律规则，以平衡技术创新与版权保护之间的关系。

未来展望

随着AI技术的不断发展，版权问题将变得越来越复杂。以下是一些可能的发展趋势：

集体授权: 出版商和作者可能会联合起来，成立集体管理组织，以便与AI公司进行大规模的授权谈判。
AI版权法: 各国可能会制定专门的AI版权法，以解决AI生成作品的版权归属、侵权责任等问题。