華為 Atlas 950

樓主 / Slowking

華為 Atlas 950 是華為在 MWC 2026（巴塞羅那世界移動通信大會）上正式亮相的新一代 AI 智算超節點（SuperPoD）。
它是華為應對萬億級參數大模型和智能體（Agentic AI）時代推出的核心算力基礎設施，旨在通過“系統級創新”打破單芯片性能受限的瓶頸，直接對標英偉達（NVIDIA）的最頂級機架系統（如 GB300 或 Vera Rubin 系列）。
以下是 Atlas 950 的核心亮點：
1. 核心架構：從“堆卡”到“超級計算機”
Atlas 950 不再是簡單的服務器堆疊，而是通過華為自研的 “靈衢”（UnifiedBus）2.0 互聯協議，將數千張芯片整合成一台邏輯上的超級計算機。
* 規模上限：單節點最大支持 8,192 張昇騰 NPU 卡高速互聯。
* 統一內存：具備 1,152 TB 的統一編址內存（HiZQ 2.0 技術），讓數據在萬億參數模型訓練時無需頻繁“搬家”，實現就地計算。
* 超高帶寬：系統總互聯帶寬高達 16.3 PB/s，互聯延遲縮短至微秒級。
2. 算力表現
根據華為在 MWC 2026 公布的數據，Atlas 950 在系統級表現上非常強悍：
* 算力峰值：整套系統（由 160 個機櫃組成）可提供約 8 EFLOPS 的 FP8 算力和 16 EFLOPS 的 FP4 算力。
* 對比優勢：在特定大規模訓練場景下，其算力規模和內存容量相比英偉達 NVL144 集群有顯著的倍數領先。
3. 技術指標參考
| 特性 | 規格/描述 |
|---|---|
| 互聯協議 | 靈衢（UnifiedBus）2.0 |
| 最大規模 | 8,192 卡（單櫃通常為 64 卡基本單元） |
| 內存容量 | 1,152 TB (統一編址) |
| 數據格式 | 支持 FP16, BF16, FP8, MXFP4, HiF4 等 |
| 應用場景 | 萬億級大模型訓練、海量高並發推理、Agentic AI 基礎設施 |
4. 為什麼 Atlas 950 很重要？
* 自主可控的突圍：在先進工藝受限的情況下，華為通過液冷、光互聯和內存池化等“系統級創新”，用成熟工藝的芯片組合出了超越頂尖單芯片集群的系統性能。
* 軟件生態開源：配套的 CANN 異構計算架構已全面開源，支持 Triton、PyTorch、vLLM 等主流框架，極大降低了從英偉達生態遷移的難度。
* 面向未來：它不僅支持當前的生成式 AI，更針對上下文長度從 K 級躍升至 M 級（百萬級）的智能體應用做了深度優化。

了解 Atlas 950 在具體大模型（如 DeepSeek 或盤古）上的訓練表現