華為 Atlas 950 是華為在 MWC 2026(巴塞羅那世界移動通信大會)上正式亮相的新一代 AI 智算超節點(SuperPoD)。
它是華為應對萬億級參數大模型和智能體(Agentic AI)時代推出的核心算力基礎設施,旨在通過“系統級創新”打破單芯片性能受限的瓶頸,直接對標英偉達(NVIDIA)的最頂級機架系統(如 GB300 或 Vera Rubin 系列)。
以下是 Atlas 950 的核心亮點:
1. 核心架構:從“堆卡”到“超級計算機”
Atlas 950 不再是簡單的服務器堆疊,而是通過華為自研的 “靈衢”(UnifiedBus)2.0 互聯協議,將數千張芯片整合成一台邏輯上的超級計算機。
* 規模上限:單節點最大支持 8,192 張 昇騰 NPU 卡高速互聯。
* 統一內存:具備 1,152 TB 的統一編址內存(HiZQ 2.0 技術),讓數據在萬億參數模型訓練時無需頻繁“搬家”,實現就地計算。
* 超高帶寬:系統總互聯帶寬高達 16.3 PB/s,互聯延遲縮短至微秒級。
2. 算力表現
根據華為在 MWC 2026 公布的數據,Atlas 950 在系統級表現上非常強悍:
* 算力峰值:整套系統(由 160 個機櫃組成)可提供約 8 EFLOPS 的 FP8 算力和 16 EFLOPS 的 FP4 算力。
* 對比優勢:在特定大規模訓練場景下,其算力規模和內存容量相比英偉達 NVL144 集群有顯著的倍數領先。
3. 技術指標參考
| 特性 | 規格/描述 |
|---|---|
| 互聯協議 | 靈衢(UnifiedBus)2.0 |
| 最大規模 | 8,192 卡(單櫃通常為 64 卡基本單元) |
| 內存容量 | 1,152 TB (統一編址) |
| 數據格式 | 支持 FP16, BF16, FP8, MXFP4, HiF4 等 |
| 應用場景 | 萬億級大模型訓練、海量高並發推理、Agentic AI 基礎設施 |
4. 為什麼 Atlas 950 很重要?
* 自主可控的突圍:在先進工藝受限的情況下,華為通過液冷、光互聯和內存池化等“系統級創新”,用成熟工藝的芯片組合出了超越頂尖單芯片集群的系統性能。
* 軟件生態開源:配套的 CANN 異構計算架構 已全面開源,支持 Triton、PyTorch、vLLM 等主流框架,極大降低了從英偉達生態遷移的難度。
* 面向未來:它不僅支持當前的生成式 AI,更針對上下文長度從 K 級躍升至 M 級(百萬級)的智能體應用做了深度優化。
了解 Atlas 950 在具體大模型(如 DeepSeek 或盤古)上的訓練表現