[華為] 擺脫輝達?傳DeepSeek R2全部用華為芯片
美國AI圈,甚至引發輝達的股價暴跌。在中國與全球AI競爭對手的高度關注下,市場傳出更強的新版本DeepSeek R2即將在5月面世,將徹底擺脫輝達芯片,全部基於華為昇騰910B(Ascend 910B)芯片。
陸媒報道,市場最新爆料,R2大模型將采用更先進的混合專家模型(MoE),總參數量較前代R1提升約1倍,預計達1.2兆(R1總參數量為6710億),單位推理成本較GPT-4大減97.4%。
當下,中國與美國科技戰、貿易戰愈演愈烈,輝達H20芯片面臨新一波出口管制。在DeepSeek R2預期發布時間臨近的情況下,各界高度關注中國指標性的大模型,在缺乏美國芯片資源下的發展動向。
據傳,R2規模與ChatGPT的GPT-4 Turbo以及谷歌的Gemini 2.0 Pro相當,還將結合更智慧的門控網絡層(Gating Network),進而優化高負載推理任務的性能。
消息指出,R2將徹底擺脫輝達芯片,訓練全程均未使用輝達顯卡,全部基於華為的昇騰910B(Ascend 910B)芯片集群平台。
如果這一消息屬實,這將降低中國對海外高端AI芯片的依賴。

(示意圖)
您的點贊是對我們的鼓勵
好新聞沒人評論怎麼行,我來說幾句
年初中企深度求索的DeepSeek R1大模型的問世撼動陸媒報道,市場最新爆料,R2大模型將采用更先進的混合專家模型(MoE),總參數量較前代R1提升約1倍,預計達1.2兆(R1總參數量為6710億),單位推理成本較GPT-4大減97.4%。
當下,中國與美國科技戰、貿易戰愈演愈烈,輝達H20芯片面臨新一波出口管制。在DeepSeek R2預期發布時間臨近的情況下,各界高度關注中國指標性的大模型,在缺乏美國芯片資源下的發展動向。
據傳,R2規模與ChatGPT的GPT-4 Turbo以及谷歌的Gemini 2.0 Pro相當,還將結合更智慧的門控網絡層(Gating Network),進而優化高負載推理任務的性能。
消息指出,R2將徹底擺脫輝達芯片,訓練全程均未使用輝達顯卡,全部基於華為的昇騰910B(Ascend 910B)芯片集群平台。
如果這一消息屬實,這將降低中國對海外高端AI芯片的依賴。

(示意圖)


分享: |
注: |