空間首頁 | 博客 | 相冊 | 存檔 | 朋友和群組 | 個人資料 | 留言

DeepSeek硬體投資或逾5億美元。轉帖 

艾am板豬 發表於 - 2025-02-01 22:20:38
中國人工智能(AI)公司DeepSeek推出的新模型DeepSeek-R1因性價比高而廣受關注,成本多少成為外界焦點,半導體研究機構SemiAnalysis發表報告,估計DeepSeek公司歷年來的硬體投資支出為遠高於5億美元。

DeepSeek在2024年12月公布的文件中,透露其模型DeepSeek V3的訓練成本為557.6萬美元,低廉的成本引起關注。文件註明成本僅包括V3的官方訓練(official training),不包括與架構、演算法或資料相關的先前研究和消融實驗(ablation experiments)的成本。

半導體研究與諮詢機構SemiAnalysis發表報告,估計DeepSeek公司的歷來硬體投資支出為遠高於5億美元,並指研發成本和整體成本也相當可觀,稱為模型訓練制作「合成資料」需要大量的計算力。

報告稱「為開發新的架構方法,在模型開發過程中,需要花費大量資金來測試新想法、新的架構理念和消融(ablations)。」

2023年時,外界估計OpenAI的GPT-4訓練成本達到6300萬美元。

作為一家中國AI初創公司,DeepSeek在海外遭到諸多質疑。
作為一家中國AI初創公司,DeepSeek在海外遭到諸多質疑。


QR Code
請用微信 掃一掃 掃描上面的二維碼,然後點擊頁面右上角的 ... 圖標,然後點擊 發送給朋友分享到朋友圈,謝謝!
分享:
分享到微信

文章評論

現在還沒有任何評論,歡迎您發表您的看法或者回復。

發表評論

很抱歉,僅有會員才能發表評論。

點擊此處免費注冊, 或者點擊此處登錄,登錄後您便可以發表評論。謝謝!

加西網為北美中文網傳媒集團旗下網站