Meta否认盗用成人内容训练AI:企业IP下载仅为个人使用

1

科技巨头Meta近日在美国联邦法院提出动议,要求驳回一项指控其盗用成人内容训练人工智能的诉讼。这一案件引发了关于AI训练数据版权使用和企业网络管理的广泛讨论。Meta的回应不仅关乎此次诉讼结果,也可能影响整个科技行业在AI训练数据获取方面的法律边界。

诉讼背景:成人内容制作公司的指控

成人内容制作公司Strike 3 Holdings于2025年7月对Meta提起诉讼,指控这家科技巨头多年来非法下载其拥有的约2400部成人电影,目的是训练AI模型。更令人震惊的是,Strike 3声称Meta使用了一个由2500个'隐藏IP地址'组成的'隐形网络'来掩盖这些活动。

AI与版权争议

根据Strike 3的指控,这些活动可能涉及超过3.5亿美元的赔偿金额。这一指控迅速引发了科技界和法律界的广泛关注,因为如果属实,将代表大型科技公司首次被指控专门使用成人内容训练AI模型。

Meta的回应:基于'猜测和暗示'的指控

在10月27日提交给法院的动议中,Meta坚决否认了所有指控,称Strike 3的诉讼'基于猜测和暗示'。Meta的律师在文件中写道:'Strike 3被一些人标记为'版权流氓',提起的是勒索性的诉讼。'

Meta的发言人向Ars Technica表示:'这些指控是虚假的。'公司强调,没有任何证据表明Meta directed了任何关于Strike 3拥有的约2400部成人电影的下载,甚至没有任何证据表明Meta知晓这些非法活动的存在。

时间线矛盾:AI研究始于指控之后

Meta在回应中提出了一个关键的时间线问题:被标记的下载活动始于2018年,而Meta的AI研究项目——'研究多模态模型和生成视频'——大约在2022年才开始。这意味着,如果这些下载真的是为了AI训练,Meta提前了约四年开始收集相关数据。

Meta在文件中指出:'一个更明显的缺陷是,Meta的条款禁止生成成人内容,这与'此类材料可能对Meta的AI训练有用'的前提相矛盾。'

下载规模与AI训练的不匹配

Meta进一步质疑了下载规模与AI训练需求之间的不匹配。根据Meta的数据,与企业IP地址相关的下载量每年只有约22个文件,远低于AI训练所需的大规模数据集。

AI训练数据规模

Meta在文件中写道:'与那些作品被用作训练AI的庞大数据集一部分的图书作者提起的诉讼不同,在Meta企业IP地址上的活动每年只有约22次下载。这远非原告声称的有效AI训练所必需的'大规模数据集的协调努力'。'

责任归属:难以追踪的个人行为

Meta还强调,很难将这些下载活动与任何特定的Meta员工联系起来。公司指出,'Strike 3没有识别出任何 supposedly 使用这些Meta IP地址的个人,指控任何受雇于Meta或曾在Meta担任AI培训角色的人,或指明(以及哪些) alleged 下载的内容被用于训练任何特定的Meta模型。'

Meta每天有'数万名员工'以及'无数承包商、访客和第三方'可以访问其网络,因此很难确定是谁进行了这些下载。Meta在文件中提出:'虽然可能有一个或多个Meta员工在过去七年中下载了Strike 3的内容,但同样可能的是,'客人,或蹭网者',或'承包商,或供应商,或维修人员——或这些人的任何组合'对这些活动负责。'

'隐形网络'理论被斥为'荒谬'

Meta对Strike 3关于'隐形网络'的指控提出了最强烈的质疑。Strike 3声称Meta使用2500个隐藏IP地址来掩盖某些下载活动,同时使用容易追踪的Meta企业IP地址进行其他数百次下载。

Meta在文件中写道:'这提出了另一个Strike 3未能解决的难题,为什么Meta会寻求'隐藏'某些 alleged 的原告和第三方内容下载,但对许多其他下载使用容易追踪的Meta企业IP地址?'

Meta认为,'明显的答案是它不会这样做',并称Strike 3的'整个AI训练理论'是'荒谬且缺乏依据的'。

企业网络监控的法律边界

Meta还指出,Strike 3不能声称Meta本应更好地'监控'其网络以防止非法活动。Meta在文件中辩称:'监控使用Meta全球网络的任何个人下载的每个文件将是一项异常复杂和侵入性的工作。'

Meta援引先例指出,只要求Meta采用'简单措施'监控此类活动即可。这一论点触及了企业网络监控的法律边界问题——企业应在多大程度上监控员工和访客的网络活动。

Meta的AI内容政策

对于Meta而言,赢得这场诉讼不仅关乎避免赔偿,还关乎捍卫其确保AI视频工具不生成日益受到监管的成人内容的承诺。Meta在文件中暗示,Strike 3未能提供Meta在其内容上训练AI的证据,因为'根本没有这样的证据'。

Meta的发言人向Ars Technica表示:'我们不想要这类内容,我们采取 deliberate 步骤避免在这种材料上训练。'

案件进展与潜在影响

根据TorrentFreak的报道,Strike 3有两周时间对此作出回应。此案的结果可能对AI训练数据的版权使用产生深远影响,特别是当涉及有争议内容时。

随着AI技术的快速发展,训练数据的来源和版权问题已成为科技行业面临的主要法律挑战之一。Meta此次案件可能为行业设定重要先例,影响企业如何获取和使用训练数据,以及如何平衡技术创新与版权保护之间的关系。

行业反应与未来展望

尽管案件仍在审理中,但科技行业已经开始密切关注其发展。一些分析师认为,如果Meta成功驳回此案,可能会鼓励更多企业积极获取训练数据而不必担心版权问题。而另一方面,如果Strike 3胜诉,可能会促使企业更加谨慎地处理训练数据的来源问题。

无论结果如何,此案都凸显了AI技术发展过程中面临的法律和伦理挑战。随着AI模型变得越来越复杂,训练数据的获取和使用将继续成为科技行业和监管机构关注的焦点。