🔥 何が起きた?ざっくり言うと…
米国の輸出規制で「NVIDIA製チップが買えない!」と苦しんでいた中国のAI業界に、大きな転換点が訪れました 🚨
ファーウェイ(Huawei)を中心とする中国の研究チームが、自社製AIチップ「Ascend 910C」を使って、DeepSeekの最新モデル「DeepSeek-V4-Pro」の後学習(ポストトレーニング)に成功したと発表したんです!
🤔 「後学習」って何?ざっくり解説
AIモデルの開発には大きく2段階あります:
- 📚 事前学習(プレトレーニング):大量のテキストを読み込ませてAIの「頭脳」を作る、めちゃくちゃ大規模な工程
- 🎓 後学習(ポストトレーニング):「人間の指示に従わせる」「安全ルールを守らせる」「特定タスクに特化させる」調整フェーズ
今回成功したのは後学習の方。事前学習に比べると小さいステップではありますが、それでも中国製チップで本格的なAI訓練ができたという証明として注目を集めています!
📊 どんな規模だったの?
- 🧠 対象モデル:DeepSeek-V4-Pro(パラメータ数 1.6兆!現在最大のDeepSeekモデル)
- ⚙️ 使用チップ:Huawei Ascend 910C × 1,000枚以上のクラスター
- 🏢 参加機関:Huawei・深圳環状圏研究院・ハルビン工業大学深圳キャンパス・深圳ビッグデータ研究院
- 📋 手法:「フルパラメータ」での後学習(モデル全体のパラメータを調整する本格的な方式)
💪 Ascend 910Cってそもそも何者?
Huawei製のAIアクセラレーター(AI処理専用チップ)で、独自の「Da Vinci アーキテクチャ」を採用。HuaweiはNVIDIAのH100に匹敵する性能と主張しており、実際に推論(=すでに出来上がったモデルを動かす処理)においてはH100の約60%の性能を発揮するとの評価もあります。
ただし、正直なところ課題もあります。以前にDeepSeek R2の学習で同チップを試みた際は、チップの不安定性やソフトウェアの未熟さで失敗し、結局NVIDIAに戻った経緯も 😅
🌏 なぜこのニュースが重要なの?
米国は中国へのNVIDIA製AIチップ輸出を厳しく規制しています。これにより中国のAI企業は「推論はできても、訓練ができない」という壁に直面していました。今回の成功は、その壁を少しずつ崩し始めた証拠として受け止められています。
とはいえ、今回はあくまで「後学習」の成功。より大規模でコストもかかる「事前学習をゼロから国産チップで行う」という段階にはまだ到達していません。また、今回の発表にはベンチマークの詳細や所要時間なども公開されておらず、慎重に見る必要もあります。
それでも、「NVIDIA依存からの脱却」という中国の戦略が、着実に歩みを進めていることは確かです 🔑
✅ まとめ
AI覇権をめぐる米中の「チップ戦争」はまだまだ続きます。今後DeepSeekや他の中国AI企業が国産チップでどこまで性能を引き上げていけるか、引き続き注目です👀
出典: https://ledge.ai/articles/huawei_ascend_910c_deepseek_v4_pro_post_training
関連リンク
- Huawei-led team claims it post-trained DeepSeek's 1.6-trillion-parameter model(Tom's Hardware)
- DeepSeek, Huawei, Export Controls, and the Future of the U.S.-China AI Race(CSIS)
- Huawei製AIチップ「Ascend 910C」、NVIDIA「H100」の60%の推論性能を達成(Ledge.ai)
- Post-training of DeepSeek-V4-Pro on Huawei Ascend 910C(GIGAZINE英語版)
