[加州] 一文看懂中國DeepSeek!為何撼動硅谷科技股價
投資顧問馬克·安德森(Marc Andreessen)
中國的人工智慧以及大型語言模型公司“深度求索”(DeepSeek)是2023年7月才由對沖基金“幻方量化”在浙江杭州創立的一間新創公司,不過這間公司去年底發表的DeepSeek-V3語言模型卻技驚四座。因為該公司宣稱,DeepSeek-V3的訓練僅僅用了2048塊輝達H800型GPU(針對中國市場的閹割低配版GPU)、運行55天變大功告成,訓練耗資557.6萬美元,評測成績卻能與GPT-4o、Claude 3.5-Sonnet等西方頂尖語言模型並駕齊驅,甚至在數學、程式碼、自然語言推理等領域的性能超越了OpenAI o1正式版。
《華爾街日報》分析,這意味著美國政府的出口管制根本無法阻止中國AI技術的快速發展。
1月20日,DeepSeek推出了AI模型R1,這是一款為解決復雜問題而設計的專用模型。為川普(Trump)提供諮詢的矽谷風險投資家馬克·安德森(Marc Andreessen)在X上贊歎“這是最令人印象深刻的突破”。《紐時》認為,DeepSeek令矽谷贊歎與震動,不是因為這個中國的人工智慧語言模型幹掉了西方或美國的語言模型,而是中國的AI公司使用了遠少於西方AI公司的芯片數量進行研發,這甚至不是目前最先進的芯片,卻能做出一個實力接近西方的AI模型。而且在某些情況下,甚至跳過了美國研發者認為不可或缺的步驟。
AI開發商Anthropic的首席執行官達裡奧·阿莫代(Dario Amodei)去年曾表示,構建AI模型的成本在1億至10億美元之間,但DeepSeek只花了為560萬美元,這個數字也不到科技巨頭Meta訓練其最新AI模型投入資金的十分之一。加上DeepSeek做的是開源模型,AI模型的軟體程式碼可免費獲取。舊金山AI硬體公司Positron的聯合創始人巴雷特·伍德賽德(Barrett Woodside)說,他和同事一直在熱烈討論DeepSeek,他們目前認為DeepSeek的唯一缺點是中國的言論管制,因為DeepSeek不會回答習近平的敏感問題,但由於程式完全開源,其他開發人員可以自由移除這項限制。
DeepSeek表示,無論最新的R1或者去年底發表的V3,表現都優於或接近西方領先的模型。截至上周六,這兩個版本的DeepSeek在Chatbot Arena上均排名前十。Chatbot Arena是由加州大學伯克利分校(University of California, Berkeley)研究人員營運的評比平台,對聊天機器人的性能進行評級。目前位列第一的是Google的Gemini,DeepSeek的排名則超過了Anthropic的Claude以及伊隆·馬斯克(Elon Musk)麾下xAI的Grok。

AI芯片目前被視為美中科技戰的核心,所以輝達(Nvidia)才會那麼炙手可熱,美國政府也才會那麼努力限制AI芯片的出口。但DeepSeek的表現美國的貿易限制顯得如此無力,因為中國研究人員在被迫使用網上免費工具來發揮創造力,卻仍能做出能力不亞於競爭對手表現的產品。風險投資公司Page One Ventures的投資人克裡斯·尼科爾森(Chris Nicholson)說:“擁有600萬美元資金的公司,在數量上遠遠多於有1億美元或10億美元資金的公司。”這也意味著,過去認為“只有掌握巨額資金、有本事大量購入AI尖端芯片的科技巨頭才有能力發展AI”的觀念,如今必須修正—即使是資源微不足道的組織或者企業,也能構建具有競爭力的系統。
DeepSeek的橫空出世,也讓日本芯片公司Disco Corp和輝達的合作伙伴愛德萬測試(Advantest)27日分別下跌2.6%和8.8%,中國領先的芯片制造商中芯國際下跌2.9%。美國的隔夜交易顯示,人工智慧風向球輝達(Nvidia)可能在周五收盤時開盤下跌。東京一位基金經理對日本科技股的突然下跌表示“肯定是DeepSeek的原因”,他對英國《金融時報》表示,市場正在重新調整觀念,即人工智慧的硬體支出可能比目前的估計低得多。
1
這條新聞還沒有人評論喔,等著您的高見呢
“Deepseek R1是我見過的最令人驚歎、最令人印象深刻的突破之一”、“這是AI的史普尼克(Sputnik)時刻。”引自川普的矽谷風險中國的人工智慧以及大型語言模型公司“深度求索”(DeepSeek)是2023年7月才由對沖基金“幻方量化”在浙江杭州創立的一間新創公司,不過這間公司去年底發表的DeepSeek-V3語言模型卻技驚四座。因為該公司宣稱,DeepSeek-V3的訓練僅僅用了2048塊輝達H800型GPU(針對中國市場的閹割低配版GPU)、運行55天變大功告成,訓練耗資557.6萬美元,評測成績卻能與GPT-4o、Claude 3.5-Sonnet等西方頂尖語言模型並駕齊驅,甚至在數學、程式碼、自然語言推理等領域的性能超越了OpenAI o1正式版。
《華爾街日報》分析,這意味著美國政府的出口管制根本無法阻止中國AI技術的快速發展。
1月20日,DeepSeek推出了AI模型R1,這是一款為解決復雜問題而設計的專用模型。為川普(Trump)提供諮詢的矽谷風險投資家馬克·安德森(Marc Andreessen)在X上贊歎“這是最令人印象深刻的突破”。《紐時》認為,DeepSeek令矽谷贊歎與震動,不是因為這個中國的人工智慧語言模型幹掉了西方或美國的語言模型,而是中國的AI公司使用了遠少於西方AI公司的芯片數量進行研發,這甚至不是目前最先進的芯片,卻能做出一個實力接近西方的AI模型。而且在某些情況下,甚至跳過了美國研發者認為不可或缺的步驟。
AI開發商Anthropic的首席執行官達裡奧·阿莫代(Dario Amodei)去年曾表示,構建AI模型的成本在1億至10億美元之間,但DeepSeek只花了為560萬美元,這個數字也不到科技巨頭Meta訓練其最新AI模型投入資金的十分之一。加上DeepSeek做的是開源模型,AI模型的軟體程式碼可免費獲取。舊金山AI硬體公司Positron的聯合創始人巴雷特·伍德賽德(Barrett Woodside)說,他和同事一直在熱烈討論DeepSeek,他們目前認為DeepSeek的唯一缺點是中國的言論管制,因為DeepSeek不會回答習近平的敏感問題,但由於程式完全開源,其他開發人員可以自由移除這項限制。
DeepSeek表示,無論最新的R1或者去年底發表的V3,表現都優於或接近西方領先的模型。截至上周六,這兩個版本的DeepSeek在Chatbot Arena上均排名前十。Chatbot Arena是由加州大學伯克利分校(University of California, Berkeley)研究人員營運的評比平台,對聊天機器人的性能進行評級。目前位列第一的是Google的Gemini,DeepSeek的排名則超過了Anthropic的Claude以及伊隆·馬斯克(Elon Musk)麾下xAI的Grok。

AI芯片目前被視為美中科技戰的核心,所以輝達(Nvidia)才會那麼炙手可熱,美國政府也才會那麼努力限制AI芯片的出口。但DeepSeek的表現美國的貿易限制顯得如此無力,因為中國研究人員在被迫使用網上免費工具來發揮創造力,卻仍能做出能力不亞於競爭對手表現的產品。風險投資公司Page One Ventures的投資人克裡斯·尼科爾森(Chris Nicholson)說:“擁有600萬美元資金的公司,在數量上遠遠多於有1億美元或10億美元資金的公司。”這也意味著,過去認為“只有掌握巨額資金、有本事大量購入AI尖端芯片的科技巨頭才有能力發展AI”的觀念,如今必須修正—即使是資源微不足道的組織或者企業,也能構建具有競爭力的系統。
DeepSeek的橫空出世,也讓日本芯片公司Disco Corp和輝達的合作伙伴愛德萬測試(Advantest)27日分別下跌2.6%和8.8%,中國領先的芯片制造商中芯國際下跌2.9%。美國的隔夜交易顯示,人工智慧風向球輝達(Nvidia)可能在周五收盤時開盤下跌。東京一位基金經理對日本科技股的突然下跌表示“肯定是DeepSeek的原因”,他對英國《金融時報》表示,市場正在重新調整觀念,即人工智慧的硬體支出可能比目前的估計低得多。


分享: |
注: | 在此頁中閱讀全文 |