Anthropic隐藏93.9%性能怪兽：Claude Mythos仅限网络防御引发AI开放性争议

2026年04月10日 471 约4分钟 News Factory

Anthropic Claude Mythos AI安全网络防御 AI伦理

当一个AI模型在基准测试中达到93.9%的惊人成绩时，按照行业惯例，这应该是一个值得大肆宣传的时刻。然而，Anthropic却选择了一条截然不同的道路——将Claude Mythos Preview锁在保险箱里，仅向网络防御机构开放。这个决定背后，隐藏着AI行业正在面临的一个根本性困境。

根据Anthropic的官方声明，Claude Mythos Preview在SWE-bench测试中取得了93.9%的成绩。SWE-bench是评估AI代码生成和问题解决能力的重要基准，这个分数意味着该模型已经接近人类专业程序员的水平。

然而，与其他AI公司急于展示技术突破不同，Anthropic选择了限制访问。据报道，该公司明确表示，由于潜在风险，Claude Mythos仅向网络防御相关机构开放，不会进行公开发布。

这一决定在X平台（原Twitter）上引发了激烈讨论。支持者认为这是负责任的AI开发典范，体现了Anthropic对AI安全的承诺。批评者则指出，这种做法可能会扼杀创新，让技术进步变成少数人的特权。

这种分裂反映出AI社区内部的一个根本性矛盾：究竟应该优先考虑安全还是进步？更深层的问题是，谁有权决定哪些技术"太危险"而不能公开？

Anthropic选择网络防御作为唯一开放领域并非偶然。在当前地缘政治环境下，网络安全已成为国家安全的重要组成部分。一个能够达到93.9%代码生成准确率的AI系统，既可能成为防御工具，也可能成为攻击武器。

通过限制访问，Anthropic试图确保这项技术首先用于防御而非攻击。但这种做法也引发了新的问题：当AI能力达到某个阈值时，是否应该像管制武器一样管制AI？

更值得关注的是，Anthropic的决定可能开创一个危险的先例。如果每家AI公司都开始根据自己的判断决定哪些技术"太危险"，整个行业可能会走向碎片化。这不仅会阻碍学术研究和开源社区的发展，还可能导致技术垄断的加剧。

同时，这种做法也可能适得其反。历史表明，技术封锁往往会刺激其他参与者加快独立研发。如果Claude Mythos真的如此强大，其他公司和国家必然会投入更多资源追赶，可能在缺乏安全考量的情况下开发出类似甚至更强大的系统。

Anthropic的决定迫使整个行业重新思考"负责任的AI开发"意味着什么。是完全透明和开放，让社会共同承担风险和收益？还是由少数公司充当守门人，决定技术的使用范围？

这个案例揭示了AI发展已经进入一个新阶段：技术能力的提升速度已经超过了我们建立相应治理框架的速度。在这种情况下，像Anthropic这样的单边决策可能是必要的临时措施，但长期来看，我们需要更广泛的社会共识和国际合作。

Claude Mythos事件不仅仅是一个产品发布决策，它标志着AI行业正在从"能做什么"转向"应该做什么"的深刻转变。这种转变虽然痛苦，但可能是确保AI技术造福人类而非威胁人类的必经之路。然而，如何在安全与创新之间找到平衡，仍然是一个没有标准答案的开放性问题。

相关推荐