Anthropic社が発表した最新AIモデル「Claude Mythos Preview」が、サイバーセキュリティ分野においてこれまでのAIの限界を大きく上回る能力を示しました。英国のAIセーフティ研究所(AISI)による評価の結果、同モデルは専門家レベルのサイバータスクで高い成功率を記録し、企業ネットワークへの模擬攻撃を完遂した初のAIモデルとなりました。この進展は、デジタル資産の保護を担うセキュリティチームにとって、AIによる脅威への即時対応が不可欠な段階に入ったことを示唆しています。
専門家レベルの課題解決と脆弱性の自律的な発見
AISIが公開した評価結果によると、Claude Mythos Previewは「Capture the Flag(CTF:フラッグ取得)」形式のテストにおいて、専門家レベルの課題の73%を解決しました。2025年4月以前には、このレベルの課題を一つでも完遂できるAIモデルは存在しなかったと報告されています。
本モデルは「Copybara」と呼ばれる第4ティアの能力を備えており、LinuxカーネルやFirefoxといった主要なソフトウェアの脆弱性を自律的に発見し、実際の攻撃に使用可能なエクスプロイト(脆弱性悪用プログラム)を作成する能力を有しているとされています。これにより、従来は高度な技術を持つ人間が数日を要していたタスクが、AIによって大幅に短縮される可能性があります。
32段階の模擬企業ネットワーク攻撃を完遂
Claude Mythos Previewは、「The Last Ones(TLO)」と呼ばれる32段階の模擬企業ネットワーク攻撃シミュレーションにおいても顕著な成果を上げました。このテストは、初期のネットワーク侵入から最終的なネットワーク全体の制御権奪取までを網羅するもので、人間が完了するのに約20時間を要すると推定されています。
評価の結果、同モデルは10回の試行のうち3回で攻撃の全工程を完遂しました。全試行の平均では32段階中22段階をクリアしており、これは従来の最高水準であった「Claude Opus 4.6」の平均16段階を大きく上回っています。ただし、AISIは、今回のテスト環境には実環境に存在するような積極的な防御ツールや監視機能が含まれておらず、十分に防御されたシステムに対して同様の成果が得られるかは不明であるという点も指摘しています。
悪用リスクの抑制と「Project Glasswing」による限定公開
Anthropic社は、Claude Mythos Previewが持つ高いサイバー攻撃能力の悪用を防ぐため、現時点での一般公開を見送る決定を下しました。その代わりに、同モデルを活用してソフトウェアの脆弱性を発見・修正することを目的とした「Project Glasswing」を立ち上げています。
このプロジェクトを通じて、モデルへのアクセスはマイクロソフトやアップルを含む一部の主要テック企業に限定して提供されます。これは、攻撃者がAIを利用して脆弱性を武器化する前に、防御側が先んじてパッチを適用し、インフラを強化することを目指した取り組みです。
ブロックチェーン業界への影響
AIによる自律的な脆弱性発見と多段階攻撃の実行が可能になったことは、スマートコントラクトや分散型金融(DeFi)プロトコルのセキュリティにおいて新たなリスクとなります。攻撃者がAIを導入することで、脆弱性の発見から攻撃実行までの時間が極限まで短縮される「非対称な優位性」が生じる可能性があります。Web3業界のビジネスパーソンにとっては、AIを活用した監査の導入や、AIによる自動攻撃を前提としたインシデントレスポンス(事案対応)体制の再構築が、事業継続における重要な課題になると見られます。
ポイント
- Anthropicの「Claude Mythos Preview」が、AIとして初めて企業ネットワークへの模擬攻撃を完遂しました。
- 専門家レベルのサイバーセキュリティタスクにおいて73%の成功率を記録し、従来のAIモデルの限界を突破しました。
- Linuxカーネル等の主要ソフトウェアの脆弱性を自律的に発見し、攻撃プログラムを作成する能力が確認されています。
- 攻撃能力の高さから一般公開は制限され、現在は「Project Glasswing」を通じて主要テック企業によるセキュリティ強化のために活用されています。
- 防御側がAIを導入するスピードよりも、攻撃側がAIを採用する障壁が低くなることによる「攻撃の非対称性」が懸念されています。