Anthropic指控阿里巴巴用2.5万假账户提取Claude模型能力

Anthropic于2026年6月10日致信美国参议员,指控阿里巴巴通过近2.5万个虚假账户在4月22日至6月5日期间生成超过2880万次Claude交互,针对代理推理、软件工程等核心能力实施蒸馏攻击。相比此前三家中国实验室合计1600万次交互,此次规模接近两倍。事件同时伴随美国对半导体设备流向中国的质疑,凸显前沿模型能力转移的技术与政策风险。

Anthropic在2026年6月10日致美国参议员的信件中披露,阿里巴巴关联的Qwen实验室通过近25000个虚假账户,在4月22日至6月5日期间与Claude模型进行了超过2880万次交互。

攻击目标与规模

这些交互集中针对Claude的代理推理、软件工程和长周期任务能力。Anthropic称这是迄今已知规模最大的蒸馏攻击,交互量接近此前DeepSeek、Moonshot和MiniMax三家实验室合计1600万次的两倍。

Alibaba executed the largest known distillation attack on Anthropic to date.

蒸馏技术通过让较弱模型学习强模型输出,可大幅降低训练成本,但Anthropic指出,未经授权的工业化蒸馏违反服务条款,且产出模型往往安全防护较弱。

背景与并行争议

事件发生时,Anthropic正面临音乐行业版权诉讼。Universal Music Publishing Group等起诉方指控其未经许可复制超过20000首歌词用于训练,索赔超过30亿美元。Anthropic则主张合理使用。

同一时期,美国官员对受限半导体设备是否流入中国提出质疑,进一步将技术转移问题置于中美政策讨论中心。

深层动因分析

蒸馏攻击的工业化实施,反映出部分实验室在追求模型性能时,选择通过API高频调用绕过自训高昂成本。Anthropic强调,此类行为将美国数百亿美元的研发投入转化为竞争对手的补贴。

从技术执行角度看,虚假账户批量创建与持续高频交互,说明攻击方具备稳定的API访问通道和账户管理能力,而非偶发违规。产出模型若直接部署,可能将训练阶段的安全对齐缺陷放大。

政策层面,单纯依靠服务条款难以阻断跨境蒸馏。Anthropic发言人表示,需要政府与产业协调行动。当前案例显示,单靠事后披露已不足以形成有效威慑。