作家法庭幸运突破，或助集体诉讼Meta盗版下载

2026年03月31日 432 约5分钟 Ars Technica 已核实

Meta 版权诉讼 AI训练数据集体诉讼最高法院

作家法庭获利好，Meta面临AI数据版权新压力

在版权与AI训练数据的交锋中，作家们迎来关键转机。一位联邦法官近日裁定，允许作家们更容易证明Meta（前Facebook）通过BitTorrent（BT下载）方式非法获取内容的责任。这一决定可能为针对Meta的集体诉讼铺平道路，而Meta则寄希望于美国最高法院（SCOTUS）的最新裁决来逆转局面。该事件凸显了AI巨头在数据来源上的法律风险，预计将引发行业连锁反应。

事件背景：Meta的BT下载争议

据Ars Technica报道，此案起源于多名作家对Meta的版权侵权指控。他们声称，Meta为了训练其Llama系列AI模型，大规模使用BitTorrent下载网络上可获取的图书、文章等内容。这些内容多为受版权保护的作品，包括畅销小说和学术出版物。BitTorrent作为P2P文件共享协议，本用于合法文件分发，但常被用于盗版传播。

原告律师指出，Meta的工程师曾在内部文档中承认使用torrent工具下载TB级数据，以构建AI训练语料库。这与近年来多家AI公司面临的类似诉讼相呼应，例如《纽约时报》起诉OpenAI和Microsoft，以及多家媒体对Anthropic的集体诉讼。这些案件的核心问题是：AI公司是否能以'合理使用'为由，免费使用版权内容训练模型？

'法官给了作者们一个更容易攻击Meta torrenting的途径。Meta希望SCOTUS裁决能阻挡它。' —— Ars Technica 原文摘要

法庭突破细节

在加州北区联邦法院审理中，法官拒绝了Meta的动议，认定原告无需证明Meta直接下载了他们的具体作品。相反，作家们只需展示Meta的系统性torrent行为，即可推定侵权成立。这一'更容易攻击'的裁决源于证据链的简化：原告提供了Meta代码仓库的截图，显示torrent客户端集成在数据管道中。

Meta辩称，其数据采集符合'转化性使用'原则，即AI输出并非简单复制输入，且训练过程属于技术进步范畴。然而，法官认为torrent下载本身涉嫌绕过版权壁垒，类似于'大规模盗版'。此裁决类似于2023年Andersen v. Stability AI案中，艺术家对图像生成AI的胜诉，为集体诉讼打开大门。

Meta的反击与SCOTUS希望

Meta迅速回应，强调最高法院近期在Andy Warhol Foundation v. Goldsmith案中的裁决。该案认定，艺术作品的商业改编不一定构成合理使用。Meta律师认为，这一先例可类比AI训练：模型输出是'新创作'，非直接复制。Meta还援引欧盟的'文本与数据挖掘'例外法规，试图证明其行为国际合规。

尽管如此，法律专家预测，Meta的辩护面临挑战。不同于Warhol案的单一作品，Meta涉及亿万级数据，规模效应放大侵权风险。公司可能上诉至第九巡回上诉法院，甚至直达最高法院。

行业背景：AI数据饥渴与版权风暴

AI训练数据的获取已成为行业痛点。OpenAI的GPT系列依赖Common Crawl等爬虫数据集，但这些数据中约20%涉嫌版权侵权。Meta的Llama模型公开承认使用'the Pile'数据集，其中包含Books3子集—— precisely作家们起诉的核心。

据斯坦福大学HAI中心研究，全球AI公司每年数据支出超百亿美元，但合法授权内容稀缺。结果，torrent和暗网成为'灰色地带'。2024年以来，美国版权局推动'AI数据透明法'，要求公司披露训练来源。中国和欧盟也出台类似规定，如《生成式AI服务管理暂行办法》。

此案或加速'数据授权市场'兴起。多家出版商已与AI公司签约，如News Corp与OpenAI的数亿美元协议。未来，作家和出版物可能通过区块链追踪数据使用，获利分成。

编者按：AI版权战升级，伦理与创新的博弈

作为AI科技新闻编辑，我认为此案标志着版权持有者从被动防御转向主动出击。Meta的torrent行为虽高效，却暴露了AI开发的'速成心态'。长远看，强制披露训练数据将成主流，推动公平生态。但若最高法院偏向科技巨头，可能鼓励更多'先干再说'策略。

对中文读者而言，此案启示国内AI企业：合规数据投资是必然。建议创作者加入版权联盟，利用NFT等技术维权。AI时代，内容即资产，保护知识产权方能共荣。

潜在影响与展望

若集体诉讼推进，Meta或面临数十亿美元赔偿，并被迫重训模型。这将抬高行业门槛，小公司更难竞争。同时，刺激开源数据倡议，如EleutherAI的The Pile改进版。

展望2026，预计更多类似诉讼涌现。科技股投资者需警惕版权风险，AI伦理将成为董事会议题。

本文编译自Ars Technica，作者Ashley Belanger，日期2026-03-31。