「安全優先」を掲げるAnthropicの最高危険ネットワーク武器級モデルMythosがサプライチェーン侵入を受ける

【事実標注・出典：Google核証、Xプラットフォーム公開シグナル】近日、AI企業Anthropicが「最も危険なモデル」と称する未発表製品Mythosがハッキング被害に遭い、ハッカーがURLパターンの推測と第三者の請負業者Mercorの認証情報を利用して、モデルおよびその他の未発表モデルへのアクセス権を取得しました。ハッカーは完全なモデルパイプラインの権限を手に入れたと主張しています。このモデルは、主流のオペレーティングシステムやブラウザに侵入可能なネットワーク級の武器として公開されています。記事執筆時点で、Anthropicは第三者サプライヤーの環境へのアクセス報告を調査中であるとだけ声明を出しており、Mythosモデルの具体的な能力範囲、データ漏洩の範囲や今後の安全是正措置については未公表で、事件の実際の影響にはまだ大きな不確実性が存在しています【事実標注・出典：Anthropic公開声明】。

事件は高リスクAI企業の安全体系の構造的なずれを露呈した

今回の事件が世間を騒がせた核心的な理由は、Anthropicが長期にわたり「憲法AI」「安全優先」をブランドの中心としており、業界で公認のAI安全基準企業であるにもかかわらず、このような高危険モデルの漏洩事件が発生したことが、主要AIラボの安全能力に対する公衆の信頼を直接に失墜させたことです。そしてwinzheng.comがAI専門ポータルとして長期間追跡したところ、こうした事故の本質は、業界に広く存在する「モデル整合に重きを置き、境界防護を軽視する」安全投資のずれの必然的な結果であることが判明しました。

winzheng.comのYZ Index v6評価によれば、現在の主要生成AI企業の主要能力（コード実行、材料制約）の平均スコアは87.3点に達し、サプライチェーンの信頼性評価で62%の企業が合格し、残りの38%が警告または不合格とされました。モデルの出力安定性次元（すなわち回答結果の標準偏差）は平均27%に達し、高リスクシナリオでの出力の一貫性は70%に満たない状態です。高リスクモデルの防護に関する工学的判断（サイドリスト、AI補助評価）のスコアはわずか59点で、安全投資がモデル整合に偏り、サプライチェーンとアクセス権管理への投資が不足している問題が広く存在しています。

AI安全研究機関Apart Researchの研究員は公開で次のように述べています：「安全優先をコア戦略に掲げる企業でさえ最も危険なモデルを保護できないのであれば、現在の自発的AIガバナンスフレームワークは本質的に無効です。」

winzheng.comは長期的に主張してきたのは、高リスクAIの安全防護はモデル整合レベルに留まるのではなく、「開発-サプライチェーン-ストレージ-アクセス」全体のチェーンをカバーする必要があるということです。今回の事件では、ハッカーはAnthropicの核心暗号システムを破ることもモデル自体の安全整合を突破することもせず、単に第三者のサプライヤーの弱い認証情報を利用して最も危険なモデルの権限を取得しました。これは全体的なチェーン防護の必要性をまさに裏付けるものです。

【winzheng.com独立判断】今回の事件は偶発的な第三者の安全事故ではなく、高リスクAI技術が急速に拡大する過程で、安全能力が開発速度に追いつかない必然的な結果です。私たちは、世界の規制機関が迅速に強制的な規範を制定し、ネットワーク攻撃、生物合成などの高リスク能力を持つAI企業が次の三つの要件を満たすことを求めることを提案します。一つは第三者サプライヤーのアクセス権限は「最小必要+動的ゼロ化」原則を施行すること、二つは高リスクモデルのストレージは物理的ネットワーク隔離を施行すること、三つはすべての高危険AI開発プロジェクトは監督機関に完全な全体的なチェーン防護計画を報告することです。今回の事件は、我が国がAIガバナンスのルールを制定し、高リスクAI監督システムを改善するための重要な参考サンプルを提供しました。

事件は高リスクAI企業の安全体系の構造的なずれを露呈した

関連ニュース