-
日期: 2025-11-26 | 來源: 騰訊科技 | 有0人參與評論 | 專欄: 谷歌 | 字體: 小 中 大
2017年Transformer論文發表後,谷歌幾乎在同一時間意識到:這個新架構的計算模式高度規則、矩陣密度極高、並行度驚人,簡直是為TPU量身定做的。與其讓外部硬件廠商慢慢跟進,不如自己把軟件框架、編譯器、芯片架構、網絡拓撲、散熱系統全部握在手裡,形成全棧閉環。
於是,TPU不再是一個孤立的芯片,而升級為谷歌AI基礎設施的底座:既要訓練出世界最強的模型,也要讓AI以最低成本滲透到公司每一條產品線。
從v2、v3開始,谷歌逐步開放TPU給谷歌雲客戶,正式進入商業化階段。
雖然早期生態和兼容性仍遜於GPU,但谷歌用XLA編譯器、高效Pod架構、液冷數據中心、軟硬件深度共設計,硬生生蹚出一條差異化道路。
2021年,TPU v4橫空出世,第一次把4096顆芯片組成一個超節點,靠自研的環形拓撲網絡(2D/3D torus)實現近乎無損的跨芯片通信。這套系統讓數千顆加速器像一顆“巨型芯片”一樣協同工作,直接把谷歌帶入超大規模AI時代,PaLM 540B模型正是在v4 Pod上訓練完成的。
谷歌用實際行動證明:只要集群規模夠大、互聯效率夠高,模型性能就會隨著計算量近乎線性增長,而TPU的網絡拓撲和調度系統,正是實現這一規律的最關鍵硬件支撐。
2023到2024年,TPU v5p成為轉折點。
它首次大規模進入谷歌廣告系統、搜索核心排序、YouTube推薦、地圖實時預測等賺錢產品線,性能較v4翻倍,同時推出彈性節點架構,讓企業客戶可以按需擴展到近9000顆芯片的規模。
Meta、Anthropic等頭部模型公司開始認真評估並采購TPU v5p,這標志著TPU終於從“內部黑科技”成長為“生態可選項”。
2024年發布的第六代TPU v6(代號Trillium)則徹底亮明態度:谷歌未來的主戰場不再是訓練,而是推理。推理成本正在成為全球AI公司最大的單項支出,v6從架構到指令集全部圍繞推理負載重新設計,FP8吞吐暴漲、片上SRAM容量翻倍、KV Cache訪問模式深度優化、芯片間帶寬大幅提升,能效比上一代提升67%。
谷歌公開表示,這一代TPU的目標是成為“推理時代最省錢的商業引擎”。
從2015年為了解決AI計算的效率瓶頸被迫自研,到2025年即將把TPU部署到客戶自有數據中心,谷歌用十年時間,把一個“不得不做的救命項目”,一步步打造成可能撼動英偉達霸權的戰略級武器。
TPU從來不是為了和誰比性能,而是為了讓AI真正跑得起、賺得到錢。這正是谷歌與眾不同的打法,也是它最可怕的地方。
02 從“實驗項目”到“數據中心命脈”
TPU v7,代號Ironwood
2025年,谷歌推出的第七代TPU(TPU v7,代號Ironwood)成為全球AI基礎設施領域最受關注的硬件產品。
這一代在架構、規模、可靠性、網絡與軟件系統上的一次全面重構。
Ironwood的誕生,正式宣告TPU從“追趕者時代”邁入“進攻時代”,也標志著谷歌將推理時代視為未來十年的決戰主戰場。
Ironwood之所以特殊,首先在於它是TPU歷史上第一款專用推理芯片。與此前以訓練為主的v5p和以能效為主的v6e不同,Ironwood從第一天起就鎖定超大規模在線推理這一終極場景,並在多項關鍵指標上首次與英偉達Blackwell系列實現正面交鋒。- 新聞來源於其它媒體,內容不代表本站立場!
- 放心用AI OpenAI、Google證實:不會有…
- Google首度揭曉智慧眼鏡 3種類型可挑
- 谷歌眼鏡重新發布!聯手中國廠商殺瘋了
- 34歲韋東奕官宣喜訊,看笑話的人終於閉嘴了
- 曾是知名主持人,離開後成百億總裁
- 溫哥華會計事務所 收費低 服務好
-
- 旅行租車迎頭相撞 中國一游客被捕
- 大溫男子中彩票大獎 要回家鄉探親
- 上海老字號小楊生煎列治文店已開業
- 大溫邊上發洪水預警 這兒發疏散令
- AI致內存價格瘋漲 隨後是電腦手機
- 加拿大漁民成百萬富翁後拒絕退休
-
- 稀土"武器"正在變鈍 北京失策了
- 只有原是中國人的張本智和 才知怎麼對付中國人
- 高市早苗被曝自身難保,或提前下台 ....
- 天冷 BC官員提醒注意這種致命中毒
- 溫村草坪為啥比往年更容易被破壞
- "劉宇寧你也有今天"沖熱搜第一(圖
-
- 賽馬運動結束 大溫這公園重大變革
- 川普態度大轉彎 瞬間重塑美中冷戰格局
- 溫哥華貸款經紀 解決各類疑難貸款
- 專家: 央行降息結束 房價即將反彈
- 孩子水瓶裡加國父親發現駭人物品
- 市場預測加國央行下一步行動加息
-
目前還沒有人發表評論, 大家都在期待您的高見
