纽约时报指控微软造超级计算机助OpenAI侵权

纽约时报指控微软造超级计算机助OpenAI侵权
美国最高法院近日对索尼相关版权案作出不利裁决后,纽约时报迅速调整了对OpenAI和微软的诉讼策略,转而指控微软专门建造超级计算机以协助OpenAI大规模侵犯其新闻版权。该指控将科技巨头间的AI版权之争推向新高潮,也引发了对AI训练数据合法性及科技公司间协作边界的深刻讨论。

在生成式AI浪潮席卷全球的背景下,版权纠纷正成为悬在科技巨头头顶的达摩克利斯之剑。据Ars Technica报道,纽约时报(NYT)在最新修改的起诉书中,抛出一枚重磅炸弹:指控微软专门为OpenAI建造了超级计算机基础设施,以帮助后者系统性地侵犯其新闻作品的版权。

指控核心:超级计算机成侵权新证据

这份经过修订的诉状指出,微软与OpenAI的合作远不止是简单的投资关系——微软不仅提供了Azure云计算资源,更“特意设计并建造了一套高性能超级计算机系统”,用于训练包括GPT-4在内的大型语言模型。NYT声称,这些模型在训练过程中大量使用了其受版权保护的新闻报道,而微软明知这一行为侵权,却通过提供算力支持成为“共同侵权者”。

这一指控的提出时机耐人寻味。就在此前不久,美国最高法院在涉及索尼的另一起版权案件中作出了不利于版权方的裁决,限制了版权持有人对第三方使用技术的追索范围。法律分析人士指出,NYT显然在借鉴该裁决的经验教训,试图从技术提供方的“主动参与”角度构建更具说服力的侵权链条——即不仅要证明AI模型输出了侵权内容,更要证明基础设施供应商是侵权的有意促成者。

“这起诉讼标志着AI版权纠纷从‘模型输出’阶段进入了‘训练基础设施’阶段。”——版权法律师、斯坦福大学互联网与社会中心研究员 李明远

背景透视:OpenAI与微软的深度绑定

自2019年微软向OpenAI投资10亿美元以来,两家公司的合作关系不断加深。到2023年,微软已累计投入超130亿美元,不仅获得了GPT模型的独家商业授权,还深度参与其算力架构设计。据公开资料,微软为训练GPT-4搭建的Azure AI超级计算机使用了数万颗英伟达GPU,其算力规模仅次于部分国家级的超算中心。

NYT在2023年12月首次起诉OpenAI和微软,指控其“大规模、系统性地”复制并利用NYT文章训练AI模型。当时诉讼主要聚焦于模型直接输出原文段落、生造虚假引用等问题。但最高法院对索尼案的裁决——该案限制了版权方基于技术使用方式提出的间接侵权主张——促使NYT的法律团队调整策略:与其纠缠于“模型是否‘学习’了受保护内容”这类难以量化的问题,不如直击“建造专用超级计算机这个明确的技术协作行为本身”。

编者按:科技与版权的新博弈

这起案件折射出AI时代版权法面临的深层挑战。传统版权法的“复制—表达”二分法在机器学习场景中变得模糊:训练一个模型是否需要事先获得每篇作品的授权?提供算力平台的公司是否应承担“帮助侵权”责任?

纽约时报的诉讼策略转变,本质上是在打一场“事实上的因果关系”战。它试图将“微软建造专用超算”这一具体可查的技术行为,作为连接“数据输入”与“侵权输出”的关键锁链。如果法院接受这一逻辑,那么未来任何为AI训练提供专用算力的云服务商都可能面临类似风险——这意味着大模型训练的成本可能从“算力投入”骤增至“版权授权费”的叠加。

当然,微软和OpenAI也有充足的反驳理由:超级计算机本身是中性技术,其设计目的是加速训练而非专门侵权;NYT的文章在公开互联网上可被合法抓取;且AI模型对文本的“学习”属于合理使用范畴。这场诉讼的走向,可能重塑整个AI产业链的合作模式。

“无论判决结果如何,此案都已将一个核心问题摆上台面:在AI吞噬知识的时代,人类创造的智慧结晶究竟应该如何被‘喂养’给机器?”

截至发稿,微软和OpenAI均未就修改后的诉状作出正式回应。但知情人士透露,双方已着手准备大量技术证据,包括详细展示超算架构文档、数据清洗流程以及模型训练合规性报告。这场算力与版权的战争,才刚刚拉开序幕。

本文编译自Ars Technica