Anthropic指控阿里巴巴用2.5万假账户提取Claude模型能力

2026年07月05日 16 约2分钟 News Factory 已核实

AI安全中美科技竞争模型蒸馏

Anthropic在2026年6月10日致美国参议员的信件中披露，阿里巴巴关联的Qwen实验室通过近25000个虚假账户，在4月22日至6月5日期间与Claude模型进行了超过2880万次交互。

这些交互集中针对Claude的代理推理、软件工程和长周期任务能力。Anthropic称这是迄今已知规模最大的蒸馏攻击，交互量接近此前DeepSeek、Moonshot和MiniMax三家实验室合计1600万次的两倍。

Alibaba executed the largest known distillation attack on Anthropic to date.

蒸馏技术通过让较弱模型学习强模型输出，可大幅降低训练成本，但Anthropic指出，未经授权的工业化蒸馏违反服务条款，且产出模型往往安全防护较弱。

事件发生时，Anthropic正面临音乐行业版权诉讼。Universal Music Publishing Group等起诉方指控其未经许可复制超过20000首歌词用于训练，索赔超过30亿美元。Anthropic则主张合理使用。

同一时期，美国官员对受限半导体设备是否流入中国提出质疑，进一步将技术转移问题置于中美政策讨论中心。

蒸馏攻击的工业化实施，反映出部分实验室在追求模型性能时，选择通过API高频调用绕过自训高昂成本。Anthropic强调，此类行为将美国数百亿美元的研发投入转化为竞争对手的补贴。

从技术执行角度看，虚假账户批量创建与持续高频交互，说明攻击方具备稳定的API访问通道和账户管理能力，而非偶发违规。产出模型若直接部署，可能将训练阶段的安全对齐缺陷放大。

政策层面，单纯依靠服务条款难以阻断跨境蒸馏。Anthropic发言人表示，需要政府与产业协调行动。当前案例显示，单靠事后披露已不足以形成有效威慑。

相关推荐