| 廣告聯系 | 簡體版 | 手機版 | 微信 | 微博 | 搜索:
歡迎您 游客 | 登錄 | 免費注冊 | 忘記了密碼 | 社交賬號注冊或登錄

首頁

新聞資訊

論壇

溫哥華地產

大溫餐館點評

溫哥華汽車

溫哥華教育

黃頁/二手

旅游

別盯著GPU了,CPU正成為AI時代的"新瓶頸"


請用微信 掃一掃 掃描上面的二維碼,然後點擊頁面右上角的 ... 圖標,然後點擊 發送給朋友分享到朋友圈,謝謝!
在AI狂飆的這些年裡,行業幾乎被一條邏輯主導:算力決定上限,而GPU就是算力的核心。


不過,進入2026年,這套邏輯開始變動:模型推理不再是唯一瓶頸,系統性能越來越取決於執行與調度能力。GPU依然重要,但決定AI“能不能跑起來”的關鍵,正逐漸轉向長期被忽視的CPU。

美國當地時間4月9日,谷歌與英特爾達成多年協議,在全球AI數據中心規模部署英特爾的“Xeon至強處理器”,正是為了破解這個瓶頸。英特爾CEO陳立武直言,AI運行在整個系統上,CPU和IPU才是性能、效率和靈活性的關鍵。換句話說,過去兩年被當作“配角”的CPU,正在卡住AI擴展的脖子。


CPU不再只是一個被動的配套組件,而正在成為AI基礎設施中的關鍵變量之一。

01 一場“悄無聲息”的供應危機

當大家都在盯著GPU的交貨周期時,CPU市場的緊張氣氛已經悄然拉滿。

根據多家IT分銷商的最新報告,2025年第四季度,服務器CPU的平均售價上漲了約30%。這種漲幅在相對成熟的CPU市場是非常罕見的。

AMD數據中心負責人福雷斯特·諾羅德(Forrest Norrod)透露,過去三個季度,CPU需求的增長速度超乎想象。目前,AMD的交付周期已經從原來的八周延長到了十周以上,部分型號甚至面臨長達六個月的延遲。

這種短缺主要由於“次級效應”引發的擠兌。有業內人士表示,由於台積電的3nm生產線極其緊張,原本分配給CPU的晶圓產能,正不斷被利潤更高的GPU訂單資源擠占。這導致了一個極具諷刺意味的局面:AI實驗室擁有了足夠的GPU,卻發現市場上買不到足夠的頂級CPU來“帶”動這些顯卡。

在這一輪CPU搶購潮中,還有埃隆·馬斯克(Elon Musk)。


英特爾首席執行官陳立武在社交平台上證實,馬斯克已委托英特爾為其在得克薩斯州的“Terafab”項目設計並制造定制芯片。這個龐大的項目旨在為xAI、SpaceX和特斯拉提供統一的計算底座。

馬斯克對英特爾的信任,在很大程度上是因為英特爾正試圖將自己嵌入到從地面數據中心到太空軌道計算的每一個層面。



對於英特爾來說,這無疑是一劑強心針。有行業分析師預測AMD在服務器CPU市場的收入份額將在2026年超過英特爾,但英特爾在x86生態系統中的深厚慣性和制造能力,依然是馬斯克這類大客戶無法忽視的籌碼。


這種跨行業的深度捆綁,正讓CPU市場的競爭從單純的參數比拼,升級為生態系統和供應鏈穩定性的博弈。

02 為什麼CPU會成為“短板”?

CPU突然成為瓶頸,核心是它需要承擔的工作,在智能體時代發生了根本性變化。

在傳統聊天機器人模式中,CPU主要負責調度和數據處理,GPU承擔核心推理計算。由於計算密集型環節集中在GPU側,整體延遲通常由GPU主導,CPU很少成為性能瓶頸。

但智能體工作負載完全不同。 一個智能體需要執行多步推理、調用API、讀寫數據庫、編排復雜業務流,並將中間結果整合為最終輸出。搜索、API調用、代碼執行、文件I/O和結果編排等任務,大部分落在CPU和主機系統側。GPU負責token生成(即 “思考”),而CPU負責將“思考”結果轉化為實際行動。

喬治亞理工學院學者在2025年11月發表的論文《以CPU為中心的智能體型AI視角》(A CPU-Centric Perspective on Agentic AI)中,對智能體工作負載中的延遲分布進行了量化分析。研究發現,CPU端工具處理所占用的時間,占總延遲的50%至90.6%。在某些場景下,GPU已准備好處理下一批任務,而CPU仍在等待工具調用返回。
點個贊吧!您的鼓勵讓我們進步     還沒人說話啊,我想來說幾句
上一頁123下一頁
注:
  • 新聞來源於其它媒體,內容不代表本站立場!
  • 在此頁閱讀全文
    猜您喜歡:
    您可能也喜歡:
    我來說兩句:
    評論:
    安全校驗碼:
    請在此處輸入圖片中的數字
    The Captcha image
    Terms & Conditions    Privacy Policy    Political ADs    Activities Agreement    Contact Us    Sitemap    

    加西網為北美中文網傳媒集團旗下網站

    頁面生成: 0.0305 秒 and 5 DB Queries in 0.0041 秒