语言: English | 简体中文 | 繁體中文

摆脱辉达?传DeepSeek R2全部用华为芯片 | Finance


[华为] 摆脱辉达?传DeepSeek R2全部用华为芯片

QR Code
请用微信 扫一扫 扫描上面的二维码,然后点击页面右上角的 ... 图标,然后点击 发送给朋友分享到朋友圈,谢谢!
年初中企深度求索的DeepSeek R1大模型的问世撼动美国AI圈,甚至引发辉达的股价暴跌。在中国与全球AI竞争对手的高度关注下,市场传出更强的新版本DeepSeek R2即将在5月面世,将彻底摆脱辉达芯片,全部基于华为昇腾910B(Ascend 910B)芯片。

陆媒报道,市场最新爆料,R2大模型将采用更先进的混合专家模型(MoE),总参数量较前代R1提升约1倍,预计达1.2兆(R1总参数量为6710亿),单位推理成本较GPT-4大减97.4%。

当下,中国美国科技战、贸易战愈演愈烈,辉达H20芯片面临新一波出口管制。在DeepSeek R2预期发布时间临近的情况下,各界高度关注中国指标性的大模型,在缺乏美国芯片资源下的发展动向。


据传,R2规模与ChatGPT的GPT-4 Turbo以及谷歌的Gemini 2.0 Pro相当,还将结合更智慧的门控网络层(Gating Network),进而优化高负载推理任务的性能。


消息指出,R2将彻底摆脱辉达芯片,训练全程均未使用辉达显卡,全部基于华为的昇腾910B(Ascend 910B)芯片集群平台。

如果这一消息属实,这将降低中国对海外高端AI芯片的依赖。




(示意图)
觉得新闻不错,请点个赞吧     好新闻没人评论怎么行,我来说几句
Note:
  • 新闻来源于其它媒体,内容不代表本站立场!
  • 延伸阅读

    _RELATED_NEWS_MORE

    当前评论

    当前评论目前还没有任何评论,欢迎您发表您的看法。
    发表评论
    您的评论 *:
    Security Code *:
    Please input the number which is shown on the following picture
    The Captcha image
      (Please input the number which is shown on the following picture)