| 廣告聯系 | 簡體版 | 手機版 | 微信 | 微博 | 搜索:
歡迎您 游客 | 登錄 | 免費注冊 | 忘記了密碼 | 社交賬號注冊或登錄

首頁

新聞資訊

論壇

溫哥華地產

大溫餐館點評

溫哥華汽車

溫哥華教育

黃頁/二手

旅游

一文讀懂GPT-5.4 打個招呼80美元就燒完了


請用微信 掃一掃 掃描上面的二維碼,然後點擊頁面右上角的 ... 圖標,然後點擊 發送給朋友分享到朋友圈,謝謝!



手捧GPT-5.4的奧特曼。圖片由AI生成

文|曉靜


編輯|徐青陽

北京時間3月6日凌晨,OpenAI正式發布新一代旗艦模型GPT-5.4,官方定位為"專為專業工作而設計的最強且最高效的前沿模型"。

比起“更強更快”的常規敘事,這次發布真正值得關注的是模型角色的轉變:GPT-5.4是一個為Agent而生的模型。它首次將原生計算機操控能力融入通用模型,並同時整合了GPT-5.3-Codex級別的編程能力、百萬Token上下文窗口和工具搜索機制——據官方介紹,沒有為整合而犧牲任何單項能力。過去讓AI操作電腦需要依賴專用的Computer Use Agent,現在編程、操控電腦、調用工具由同一個模型一並完成。

跑分印證了這一點:GDPval基准測試中,GPT-5.4在83%的任務上達到或超過行業專業人士水平;OSWorld桌面操控測試成功率75%,首次超過人類基線(72.4%);編程能力與GPT-5.3-Codex持平,世界知識比GPT-5.2更強。

價格方面,GPT-5.4的API定價為輸入$2.50/百萬Token、輸出$15,約為Claude Opus 4.6($5/$25)的一半,且支持訂閱額度調用。不過Pro版依然很貴——有網友僅發了一句"Hi",GPT-5.4 Pro就認真推理了一番,直接燒掉80美元。日常輕量任務,標准版可能是更明智的選擇。


在ChatGPT中,GPT-5.4以“GPT-5.4 Thinking”形式上線,逐步取代GPT-5.2 Thinking(後者將保留3個月,於2026年6月5日正式退役)。新增的前置思路概述功能讓用戶可以在模型執行過程中隨時介入調整方向,網頁版和Android已上線,iOS即將跟進。

如果用一句話概括GPT-5.4的意義,過去幾年大模型的進化邏輯是"哪塊短板補哪塊",GPT-5.4不再單點拔高,而是把所有能力整合進同一個模型做系統性優化。一個能寫代碼的模型是工具,一個能寫代碼、打開瀏覽器查文檔、調用API驗證結果、再把輸出整理成報告的模型,是工作系統。GPT-5.4更接近後者。


01 在83%的任務中達到或超過行業專業人士水平



GPT?5.4 與前代模型在多項專業能力基准測試中的表現對比

為了評估模型在真實工作環境中的表現,OpenAI使用GDPval基准測試,這項測試要求模型完成完整職業任務,而不僅僅是問答。GDPval覆蓋美國GDP貢獻最大的九個行業和四十四種職業場景,包括制作銷售演示文稿、建立會計電子表格、安排醫院急診排班、繪制制造流程圖或生成短視頻內容。


覺得新聞不錯,請點個贊吧     好新聞沒人評論怎麼行,我來說幾句
上一頁12345下一頁
注:
  • 新聞來源於其它媒體,內容不代表本站立場!
  • 在此頁閱讀全文
    猜您喜歡:
    您可能也喜歡:
    我來說兩句:
    評論:
    安全校驗碼:
    請在此處輸入圖片中的數字
    The Captcha image
    Terms & Conditions    Privacy Policy    Political ADs    Activities Agreement    Contact Us    Sitemap    

    加西網為北美中文網傳媒集團旗下網站

    頁面生成: 0.0276 秒 and 5 DB Queries in 0.0038 秒