Anthropic否认AI工具可在战争中被破坏

2026年03月21日 300 约5分钟 WIRED 已核实

Anthropic AI安全国防部军事AI 人工智能伦理

在AI技术迅猛发展的当下，军事领域的应用已成为全球关注的焦点。近日，美国国防部公开指控领先AI公司Anthropic可能在战争爆发时远程破坏或操纵其AI工具，这一说法引发轩然大波。Anthropic迅速回应，称国防部的担忧纯属误解，技术上根本不可能实现。本文将深入剖析这一事件的前因后果，并探讨AI安全在军民两用领域的深层挑战。

事件起因：国防部的安全疑虑

据WIRED报道，美国国防部（DoD）在最新文件中声称，Anthropic等AI开发者拥有能力，在战争中期通过后门或远程控制机制篡改已部署的AI模型。这可能导致美军依赖的AI系统突然失效，危及国家安全。国防部官员指出，随着AI被广泛集成到无人机、情报分析和决策支持系统中，这种潜在风险不可忽视。

这一指控并非空穴来风。近年来，美国政府加大了对AI军事化的投入，例如DARPA的AI Next计划和JADC2联合全域指挥控制系统，都依赖私营AI公司的技术支持。然而，DoD担忧这些公司——尤其是那些由前OpenAI成员创立的安全导向企业——可能因伦理立场或外部压力而在关键时刻"背叛"。

国防部文件摘录："AI开发者能够操纵模型在战争中途失效，这对国防构成不可接受的风险。"

Anthropic的强势回应

Anthropic公司高管在声明中直言不讳："这是不可能的。我们的模型设计从根本上排除了远程干预能力。"公司联合创始人Dario Amodei强调，Anthropic一贯致力于"负责任的AI开发"，其Claude系列大模型内置多层安全机制，包括宪法AI（Constitutional AI）框架，确保模型行为符合预设原则，且部署后即脱离开发者控制。

具体而言，Anthropic的模型通常以推理引擎形式交付军方，用户可本地运行或通过API访问，但核心权重和更新机制受严格加密保护。高管进一步解释，即便公司想干预，也缺乏技术途径，因为军用部署往往涉及自定义微调和隔离环境。这番回应不仅平息了部分质疑，也凸显了Anthropic在AI安全领域的领先地位。

行业背景：AI军用化的双刃剑

Anthropic成立于2021年，由前OpenAI高管创立，总部位于旧金山，以安全AI为使命。其Claude模型在性能上媲美GPT-4，却更注重可解释性和对齐性。公司已与亚马逊和谷歌合作，估值超150亿美元。然而，进入军事领域后，矛盾不可避免。

回顾历史，AI军用化浪潮自冷战时期兴起，如今进入"智能战争"时代。中国、俄罗斯等国也在加速布局，如俄罗斯的"AI国家战略"和中国的"新一代人工智能发展规划"。美国DoD通过Replicator计划计划部署数千架AI无人机，预算高达10亿美元。私营公司如Palantir、Anduril已成为关键供应商，但安全隐患始终萦绕。

类似争议并非首次。2023年，OpenAI修改政策允许军事应用，却引发伦理抗议。Anthropic则更谨慎，曾公开拒绝某些军方合同，以维护"不参与进攻性武器"的承诺。此次事件或将推动行业标准制定，如NIST的AI风险管理框架。

编者按：信任危机与未来展望

作为AI科技新闻编辑，我认为国防部的指控虽有防范之意，却暴露了政府对私营AI企业的不信任。AI模型的"黑箱"性质确实放大风险，但过度猜疑可能阻碍创新。Anthropic的否认基于技术事实，却也提醒我们：军用AI需更强的"去中心化"设计，如联邦学习或开源验证。

长远看，这一事件将加速"AI军控"讨论。国际社会或需类似《日内瓦公约》的AI公约，规范武器化边界。同时，企业应透明披露部署机制，政府则提供安全沙箱测试。平衡创新与安全的道路任重道远，但Anthropic的立场无疑为行业树立了标杆。

展望2026年，随着量子计算和多模态AI融合，战争形态将彻底变革。谁能掌控AI，谁就掌握未来。但前提是，确保AI不成为"潘多拉魔盒"。

（本文约1050字）

本文编译自WIRED，作者Paresh Dave，日期2026-03-21。

事件起因：国防部的安全疑虑

Anthropic的强势回应

行业背景：AI军用化的双刃剑

编者按：信任危机与未来展望

相关推荐