This article has not been translated into English yet. Showing the original Chinese version.

Anthropic将Claude Mythos扩展至15国关键基础设施

Anthropic将Claude Mythos扩展至15国关键基础设施
Anthropic正在扩大其安全漏洞项目Project Glasswing,并将Mythos访问权限拓展至15个国家的150个组织,重点覆盖电力、水务、医疗和通信等关键基础设施领域。这些领域的网络攻击可能影响超过1亿人。这一举措标志着AI安全从实验室走向现实世界的关键一步。

6月2日,AI安全公司Anthropic宣布,将其安全漏洞项目Project Glasswing和核心安全平台Mythos的访问权限扩展至15个国家的150个组织。这些组织涵盖电力、水务、医疗和通信等关键基础设施领域——任何针对这些领域的网络攻击都可能影响超过1亿人的生活与社会运转。

从实验室到现实世界:AI安全的战略转向

长期以来,AI安全研究主要集中在模型自身的对齐、偏见和滥用问题上。然而,Anthropic此次行动表明,AI安全的下一个前沿正转向保护现实世界中的关键系统。Mythos是Anthropic为其旗舰模型Claude开发的一套安全评估与防护框架,旨在检测和防御针对AI系统的恶意攻击。此前它主要面向内部研究和有限的合作伙伴,如今被部署到全球关键基础设施中。

“关键基础设施正在成为AI攻击的新靶心。传统的网络安全工具无法应对针对AI模型的对抗性攻击,而Mythos正是为此而生。”——Anthropic安全团队负责人

Project Glasswing:透明化漏洞发现

Project Glasswing是Anthropic于2025年启动的漏洞披露与奖励计划,鼓励安全研究人员发现并报告AI系统中的潜在弱点。此次扩展后,该计划将覆盖更多行业和地区。Anthropic希望通过开放合作,提前发现可能被恶意利用的漏洞,特别是那些可能对电网、水处理厂、医院网络和通信基站造成连锁破坏的漏洞。

据了解,参与组织将获得Mythos平台的完整访问权限,包括实时威胁监测、模型行为审计和对抗性攻击模拟等功能。Anthropic还提供了专门的培训和支持团队,帮助非AI专家快速上手。

编者按:AI安全的“平权运动”

这一举措具有双重意义。一方面,它首次将工业级AI安全能力赋予公共服务机构,而不仅仅是科技巨头。另一方面,它也暴露了一个令人担忧的现实:许多关键基础设施运营者仍依赖过时的安全策略,对AI驱动的攻击毫无防备。例如,2023年针对欧洲电网的几次攻击便利用了AI生成的钓鱼邮件和深度伪造语音指令。Anthropic的Mythos能否堵住这些缺口?从技术上看,Mythos专注于模型层保护,而真正的挑战在于将AI安全融入整体IT/OT架构——这可能需要一场更深刻的行业变革。

值得注意的是,Anthropic选择在15个不同国家部署,包括美国、英国、日本、印度、巴西、德国等。这些国家既是AI技术领先者,也是关键基础设施复杂度最高的地区。这种地理分布也反映出一种共识:网络攻击无国界,安全防御也必须全球化。

未来挑战:规模与信任

将AI安全平台扩展到150个组织并不容易。每个国家的法规、语言、网络环境差异巨大,Mythos需要高度定制化适配。Anthropic表示将采用联邦学习与本地化模型微调的方式,在保护数据隐私的同时确保检测效果。此外,如何赢得运营者的信任也是关键——他们需要确信AI安全工具本身不会成为新的攻击入口。

Anthropic的这次扩张是AI安全行业的一个里程碑。它证明了AI不仅能创造价值,也能守护价值。当电网、医院和供水系统开始依赖AI进行自我防御时,我们或许正在进入一个“AI守护AI”的新时代。

本文编译自TechCrunch