最先端の生成AI(人工知能)を巡る開発競争が激化する中、AIの安全性を揺るがす新たな形のサイバー脅威が表面化し、業界に大きな衝撃を与えています。

米国の有力AIスタートアップであるAnthropic(アンソロピック)は2026年、自社の高度なAIモデル「Claude(クロード)」に対し、中国の複数のAIラボやテック大手アリババ(Alibaba)から大規模な「蒸留攻撃(Distillation Attack)」を受けたと米議会やホワイトハウスへ相次いで報告しました。この事態は、知的財産の侵害にとどまらず、米中間のハイテク覇権争いや国家安全保障の根幹を揺るがす深刻な問題へと発展しています。

本稿では、この新しいサイバー脅威のメカニズムと、今回明らかになった事件の背景、そしてAI業界が直面するリスクについて詳細に解説します。

1. 過去最大規模の「蒸留攻撃」――狙われたClaudeの核心能力

2026年6月、米メディアの報道により、Anthropicが連邦議会(上院銀行・住宅・都市委員会)に送付した書簡の内容が明らかになりました。その中では、中国の電子商取引およびクラウド大手であるアリババが、Claudeの高度な能力を「不正に抽出」するための大規模なキャンペーンを展開していたことが告発されています。

報告によると、アリババ側は計2万5000個もの不正アカウントを組織的に作成し、地域制限などのブロックを回避。Claudeとの間で約2900万回に及ぶ膨大な対話(クエリ)を発生させていました。この攻撃がターゲットにしたのは、Claudeが持つ最も価値の高い核心的な能力、すなわち「エージェント的推論(複数のステップを踏んで複雑な問題を自律解決する能力)」「ソフトウェアエンジニアリング(高度なコード生成や修正)」「長期的なタスク処理」などであったといいます。

実は、Anthropicがこうした警告を発するのは今回が初めてではありません。今年2月にも同社は、中国の有力AIスタートアップであるDeepSeek(ディープシーク)、Moonshot AI(月之暗面)、MiniMaxの3社が、2万4000個の不正アカウントを用いて計1600万回以上のやりとりを行い、同様の「産業規模」の蒸留攻撃を行っていたと公表しています。さらに米OpenAIやGoogleも同様の被害を検知・警告しており、今回のアリババの事例は、これらを大きく上回る「過去最大規模」の攻撃として位置づけられています。

2. 「蒸留(ディスティレーション)攻撃」のメカニズムとは?

そもそも「モデル蒸留(Model Distillation)」とは、AI開発において広く使われている正当な技術の一つです。膨大なパラメータを持ち、莫大な計算資源を使って開発された高性能な「教師モデル(Teacher Model)」の出力結果(回答や推論プロセス)を、よりサイズが小さく軽量な「生徒モデル(Student Model)」の訓練データとして利用する手法を指します。これにより、スマートフォンやローカル環境でも快適に動作する、低コストで高効率なAIを開発することが可能になります。

しかし、これが「攻撃(Attack)」と呼ばれるのは、他社が巨額の資金と年月、そして最高峰の人材を投じて構築した最先端AIのAPI(外部連携窓口)に対し、利用規約を無視して機械的にクエリを連発し、その「知恵」を丸ごと盗み出す行為を指すからです。

攻撃側は、膨大な生データを集めて一から超巨大なモデルを訓練(プレトレーニング)する莫大なコストを支払うことなく、他社のAIが導き出した洗練された「答え」や「思考プロセス」を真似させるだけで、わずかな時間とコストで同等クラスの性能を持つAIを模倣・開発できてしまいます。これが、AI業界における「知の窃盗」とも言える蒸留攻撃の正体です。

3. なぜこれほど問題視されるのか?――国家安全保障と輸出規制の形骸化

今回のAnthropicによる告発が、米政府や議会で極めて重く受け止められているのには、主に3つの理由があります。

  • 国家安全保障への直接的な影響Anthropicが開発している最先端モデル(例えば高度なサイバーセキュリティ能力を持つとされる「Mythos(ミトス)」など)は、軍事的な戦略推論やサイバー攻防への適用が視野に入っており、米政府機関とも連携が進められています。こうした能力が中国の軍事・諜報機関や大衆監視システムなどに流用された場合、地政学的なバランスを崩しかねないという懸念があります。
  • 「安全対策(セーフガード)」の欠落米国の大手AIラボは、開発したモデルがバイオ兵器の製造や深刻なハッキングに悪用されないよう、厳格な倫理フィルターや安全対策を実装しています。しかし、蒸留攻撃によって「能力(回答の質)」だけを抽出された外製のモデルには、これらの安全対策(セーフガード)が引き継がれません。結果として、ブレーキのない危険な高性能AIが独裁国家や犯罪グループの手に渡るリスクが生じます。
  • 対中半導体輸出規制の「骨抜き」米国政府は、中国による先端AIの独自開発を遅らせるため、NVIDIA製などの最先端AIチップ(GPU)の対中輸出を厳しく制限しています。しかし、他国の最先端AIから効率よく能力を「蒸留」できれば、中国のラボは限られた計算資源(少ない半導体)であっても、非常に高い性能を持つAIを仕立て上げることができます。つまり、輸出規制という安全保障上の防壁を無効化する「強力な裏口」として機能してしまうのです。

4. 突きつけられるAI業界の課題と今後の展望

Anthropicは一連の事態を受け、APIトラフィックのパターンをリアルタイムで解析し、蒸留攻撃に特有の機械的・反復的なクエリを遮断する独自の分類システムの開発・導入に多額の投資を行っています。また、不正アカウントの温床になりやすい開発者向け無料枠や研究者向けアクセスの審査を大幅に強化するなど、水際での防御を急いでいます。

しかし、同社は「この問題は一企業や業界の努力だけで解決できるものではない」と訴えます。Anthropicは米政府に対し、以下の3つの具体的な介入を提言しています。

  1. 情報共有の円滑化:AIラボ同士が蒸留攻撃の脅威情報を円滑に共有できるよう、独占禁止法(反トラスト法)のガイドラインを明確化・緩和すること。
  2. 輸出規制のさらなる強化:先端AIチップへのアクセスをさらに制限し、間接的に攻撃側の計算資源(攻撃規模)を縛ること。
  3. 制裁措置の導入:蒸留を用いて米国のモデルから不当に能力を盗用している外国のラボや企業に対し、明確な経済制裁を科すこと。

生成AIの進化が指数関数的に加速する2026年現在、ネットワークの向こう側からモデルの「脳」を吸い上げるような新たなスパイ活動は、今後さらに巧妙化していくことが予想されます。官民が一体となり、法的な枠組みと最先端の技術的防衛策を融合させた「新たな安全保障体制」の確立が、今まさに求められています。

関連URL

By tokita