| 廣告聯系 | 簡體版 | 手機版 | 微信 | 微博 | 搜索:
歡迎您 游客 | 登錄 | 免費注冊 | 忘記了密碼 | 社交賬號注冊或登錄

首頁

新聞資訊

論壇

溫哥華地產

大溫餐館點評

溫哥華汽車

溫哥華教育

黃頁/二手

旅游

一文讀懂GPT-5發布會:價格屠夫、編程驚艷

QR Code
請用微信 掃一掃 掃描上面的二維碼,然後點擊頁面右上角的 ... 圖標,然後點擊 發送給朋友分享到朋友圈,謝謝!
北京時間8月8日凌晨1點的發布會上,GPT-5 總算在萬眾期待中姍姍而至,此時,距離GPT-4的發布已過去了兩年半。


但這一次,比起ChatGPT 的驚艷亮相、GPT-4 的跨越式升級、o1 發布時的震撼全場,這場發布會顯得格外平淡:不太驚艷的Benchmark,毫無新范式的影子;很難激起興趣以及看出與競品區別的用例展示;甚至還有被網友抓包的PPT展示錯誤,共同構成了這1小時20分鍾的發布會。

但這並不意味著GPT-5沒有進步。極低的幻覺率、前端能力的加強、上下文能力的躍升和極為有競爭力的價格,都是這次難得的亮點。


尤其是價格,在GPT-5精彩的編程表現之下,其API價格僅為昨天發布的Claude Opus 4.1的1/15,也比Gemini 2.5 Pro價格低。

這可以說是對Anthropic的致命一擊。

今晚的OpenAI,雖失去了魔法的節奏、但依然在和其他廠商的肉搏中站穩了腳跟。

GPT-5本體:有限的升級、微末的SOTA

本次GPT-5共有4個版本,分為GPT-5 、 GPT-5 mini、 GPT-5 nano,以及只對企業版和每月 200 美元高級版開放的GPT-5 Pro模式。

對於一般用戶而言,默認的是統一模型GPT-5,它是由多個模型組成的系統,包括用於大多數問題的“智能且快速”模型( gpt-5-main )和用於更復雜問題的“更深層推理”模型( gpt-5-thinking )。


這種統一的實現,是由一個實時路由器決定針對特定查詢使用哪個模型。

mini、nano的具體選擇則是API用戶可選。而GPT-5Pro模式,則類似於Grok 4 Hard模式,使用了並行測試計算,一次多個模型一起並行計算更長時間。它用更大的算力,提供了最全面、最精准的答案。在超高難度的科學問題(GPQA)上,它刷新了世界紀錄。在與人類專家的「盲測」中,10 次裡有近 7 次被認為更優。

而在能力和評分上,GPT-5 幾乎在每一項上都有提升,但都只比當下SOTA高了一點點,也只比o3強得很有限。


智力水平:體驗最佳,但不是智力最佳

在智力的水平,各種主流評測集裡,GPT-5都高於o3水平,但整體差距沒有非常大。



細拆下來,其中提升最明顯的前沿數學測試集裡,我們能看到,GPT-5的效果還不如ChatGPT Agent,只有使用Pro模式下才會更強。



當與其他模型做比較時,我們就能發現,GPT-5大多數“智力”能力僅僅稍微高出競爭對手一點,部分能力甚至還並非SOTA,只能說整體以微小幅度領先。很難說是什麼跨越式的能力提升。
您的點贊是對我們的鼓勵     好新聞沒人評論怎麼行,我來說幾句
注:
  • 新聞來源於其它媒體,內容不代表本站立場!
  • 在此頁閱讀全文
    猜您喜歡:
    您可能也喜歡:
    我來說兩句:
    評論:
    安全校驗碼:
    請在此處輸入圖片中的數字
    The Captcha image
    Terms & Conditions    Privacy Policy    Political ADs    Activities Agreement    Contact Us    Sitemap    

    加西網為北美中文網傳媒集團旗下網站

    頁面生成: 0.0621 秒 and 5 DB Queries in 0.0013 秒