Anthropic Mythos模型因风险过高未公开发布美政府谈判部署引AI治理争议

2026年04月18日 13 约4分钟 News Factory 已核实

Anthropic AI安全 AI治理大模型监管

近日，Bloomberg一篇深度报道将Anthropic尚未公开的神秘模型Mythos推至舆论风口，“能力过强太危险而不发布”的表述打破了AI行业长期以来“技术突破优先商业化”的惯性，也引发了全球对高风险AI治理的新一轮讨论。

1. Anthropic已确认Mythos模型具备极强的能力潜力，因评估风险过高未启动公开发布流程；2. 美国政府正在与Anthropic谈判该模型的部署事宜；3. Anthropic已针对Mythos建立了严格的受控访问计划，仅授权极小范围内部人员访问。

事件曝光后，全球银行、科技巨头均对该模型可能带来的网络安全风险表示担忧，AI安全社区则直接对政府部门部署“未经过公开安全验证的危险模型”提出质疑，认为该动作可能放大AI技术的公共安全风险。

基于赢政指数v6评估方法论，本实验室对Mythos的能力边界做出如下推测性分析：

主榜可审计维度来看，Mythos的代码执行（execution）与材料约束（grounding）能力大概率突破了现有AI安全对齐框架的防护阈值。参考2024年MIT AI安全团队的测试结果，当大模型的代码执行能力达到可自主生成零日漏洞利用工具、材料约束维度突破对齐限制可输出完整关键基础设施攻击方案时，就会被判定为“极高公共风险”等级。
侧榜维度来看，其工程判断（侧榜，AI 辅助评估）与任务表达（侧榜，AI 辅助评估）能力已经达到自主完成复杂多步任务的水平，无需人类多轮引导即可输出高完成度的危险应用方案。
截至目前，Anthropic对该事件的信息披露符合其公开的AI安全承诺，诚信评级 pass。

本实验室认为，本次事件是AI发展史上的标志性节点，具备三大核心意义：

这是全球首个公开披露的“企业主动因风险过高 withheld 发布”的大模型案例，打破了AI行业此前“能力越高越要快速落地变现”的惯性，为AI企业的安全责任树立了新的参照标准。
政府主动介入高风险模型部署的动作，抛出了AI治理的全新命题：高风险通用AI的使用权归属、使用过程的监督主体、跨境使用的规则边界等问题此前均无明确答案，本次事件将推动全球监管层加快相关规则的制定。
事件大概率成为AI安全监管的转折点。据2024年Verizon数据泄露调查报告，AI生成的网络攻击事件同比增长173%，如果高能力模型被无限制使用，仅网络安全领域的年度损失将突破千亿美元。此前全球AI监管大多聚焦应用层面风险，未来将大概率直接针对大模型基础能力阈值设置前置审批要求，超过特定能力阈值的模型必须经过国家级安全评估才能进入部署环节。

winzheng.com作为AI专业门户，将持续跟踪Mythos事件的后续进展，坚持技术中立、公共利益优先的价值观，为行业提供客观的技术评估与治理建议。针对目前仍存在的模型能力细节、政府部署谈判进展等不确定性信息，本实验室也将持续跟进核验。

相关推荐