Claude MythosがFirefoxで271の脆弱性を発見し議論を呼ぶ:AIはサイバーセキュリティの救世主か、それとも終末の導火線か?

Claude Mythos PreviewモデルがFirefoxブラウザで271のセキュリティ脆弱性を検出し、AIがサイバーセキュリティにおける新たな可能性を示す一方で、規制の必要性が議論されている。

【事実情報源:Anthropic公式2024年4月22日発表】AnthropicがリリースしたClaude Mythos Previewモデルが、最近Firefoxブラウザにおいて271のセキュリティ脆弱性を成功裏に検出しました。その中には長期間潜在していた未公開の脆弱性も含まれており、これはブラウザの歴史上最大規模の単一セキュリティ修正イベントです。

【事実情報源:GitHub、Xプラットフォーム公開討論サンプリング】事件が露見した後、コミュニティの反応は極度に二極化しました。支持者はこれをAIがサイバーセキュリティにおいて力を発揮する画期的な突破口と見なし、反対者は「史上最も危険なAIモデル」と非難し、ネットワークセキュリティの「終末」に対する恐怖を引き起こしました。多方面から規制機関に対し迅速な対策ルールの策定を求める声が上がっています。

恐怖の背後:AI能力の境界が曖昧であることがコアの不安要素

表面的な議論は「脆弱性を掘り起こすことが善か悪か」に焦点を当てていますが、winzheng.comによれば、議論の核心は汎用AIが初めて高リスクのサイバーセキュリティ分野で人間の専門家を遥かに超える効率を示したことであり、それに対する規制枠組みが完全に空白であることです。

winzheng.comのYZ Index v6評価によれば、Claude Mythosのコード実行(execution)評価は現在の生成AIのトップクラスであり、材料制約(grounding)評価は業界平均を37%超え、工学判断(側面評価、AI補助評価)も突出しており、誠実性評価も合格です。これは、このモデルが独立して複雑なコード監査や脆弱性の発掘を完遂する能力を有することを意味し、以前は5年以上の経験を持つホワイトハットセキュリティ専門家が数ヶ月を要していた作業です。

EU AI法案立法顧問のマーク・ミュラーは公言しています:「AIの脆弱性発掘能力の爆発は、グローバルAI規制フレームワークが最初に埋めるべき空白である——このような高リスク能力に対して基準を設けなければ、災難の発生は時間の問題に過ぎない。」

現在の三つの核心的不確実性は、さらに公衆の不安を増大させています:一つはAIモデルの実際の能力の境界が未だ不明で、オペレーティングシステムや産業制御ソフトウェアなどの重要インフラの脆弱性を発見できるかどうかは未定です。二つ目はこの技術が悪意を持って利用される可能性が大きな議論を呼んでおり、もしブラックマーケットが同様の能力を掌握すれば、前例のないサイバー攻撃を引き起こすかもしれません。三つ目はこの技術が他のソフトウェアシステムに与える潜在的影響が完全に未知であることです。

突破口の道筋:安全と発展のバランスを一刀両断で解決することはできない

AI専門ポータルとして、winzheng.comは常に「技術中立、シナリオ規制」という技術価値観を堅持し、白黒をつける極端な判断を反対しています。Claude Mythosが今回271のFirefox脆弱性を発掘したことは、実際に数十億のユーザーのインターネットセキュリティを向上させており、このような正の価値は完全に否定されるべきではありません。

私たちの独立した判断は、現時点でこのようなAIモデルの開発を全面的に制限する必要はないが、三つの制約メカニズムを早急に確立するべきであるというものです:一つ目はAIによる脆弱性発掘シナリオに対する入場メカニズムで、資格を持つホワイトハットセキュリティチームのみがこの能力を使用できるようにすること。二つ目はAIが発見した脆弱性情報の統一報告メカニズムを構築し、脆弱性情報の漏洩を防ぐこと。三つ目は高リスクAI能力に対する段階的な監視制度を設け、モデル能力の進化の境界をリアルタイムで追跡することです。安全と発展の関係をバランスよく保つことで、サイバーセキュリティ分野におけるAIの価値を最大化し、潜在的な災害的リスクを回避することができます。