| 广告联系 | 繁体版 | 手机版 | 微信 | 微博 | 搜索:
欢迎您 游客 | 登录 | 免费注册 | 忘记了密码 | 社交账号注册或登录

首页

新闻资讯

论坛

温哥华地产

大温餐馆点评

温哥华汽车

温哥华教育

黄页/二手

旅游

一文读懂GPT-5发布会:价格屠夫、编程惊艳

QR Code
请用微信 扫一扫 扫描上面的二维码,然后点击页面右上角的 ... 图标,然后点击 发送给朋友分享到朋友圈,谢谢!
北京时间8月8日凌晨1点的发布会上,GPT-5 总算在万众期待中姗姗而至,此时,距离GPT-4的发布已过去了两年半。


但这一次,比起ChatGPT 的惊艳亮相、GPT-4 的跨越式升级、o1 发布时的震撼全场,这场发布会显得格外平淡:不太惊艳的Benchmark,毫无新范式的影子;很难激起兴趣以及看出与竞品区别的用例展示;甚至还有被网友抓包的PPT展示错误,共同构成了这1小时20分钟的发布会。

但这并不意味着GPT-5没有进步。极低的幻觉率、前端能力的加强、上下文能力的跃升和极为有竞争力的价格,都是这次难得的亮点。


尤其是价格,在GPT-5精彩的编程表现之下,其API价格仅为昨天发布的Claude Opus 4.1的1/15,也比Gemini 2.5 Pro价格低。

这可以说是对Anthropic的致命一击。

今晚的OpenAI,虽失去了魔法的节奏、但依然在和其他厂商的肉搏中站稳了脚跟。

GPT-5本体:有限的升级、微末的SOTA

本次GPT-5共有4个版本,分为GPT-5 、 GPT-5 mini、 GPT-5 nano,以及只对企业版和每月 200 美元高级版开放的GPT-5 Pro模式。

对于一般用户而言,默认的是统一模型GPT-5,它是由多个模型组成的系统,包括用于大多数问题的“智能且快速”模型( gpt-5-main )和用于更复杂问题的“更深层推理”模型( gpt-5-thinking )。


这种统一的实现,是由一个实时路由器决定针对特定查询使用哪个模型。

mini、nano的具体选择则是API用户可选。而GPT-5Pro模式,则类似于Grok 4 Hard模式,使用了并行测试计算,一次多个模型一起并行计算更长时间。它用更大的算力,提供了最全面、最精准的答案。在超高难度的科学问题(GPQA)上,它刷新了世界纪录。在与人类专家的「盲测」中,10 次里有近 7 次被认为更优。

而在能力和评分上,GPT-5 几乎在每一项上都有提升,但都只比当下SOTA高了一点点,也只比o3强得很有限。


智力水平:体验最佳,但不是智力最佳

在智力的水平,各种主流评测集里,GPT-5都高于o3水平,但整体差距没有非常大。



细拆下来,其中提升最明显的前沿数学测试集里,我们能看到,GPT-5的效果还不如ChatGPT Agent,只有使用Pro模式下才会更强。



当与其他模型做比较时,我们就能发现,GPT-5大多数“智力”能力仅仅稍微高出竞争对手一点,部分能力甚至还并非SOTA,只能说整体以微小幅度领先。很难说是什么跨越式的能力提升。
觉得新闻不错,请点个赞吧     好新闻没人评论怎么行,我来说几句
注:
  • 新闻来源于其它媒体,内容不代表本站立场!
  • 在此页阅读全文
    猜您喜欢:
    您可能也喜欢:
    我来说两句:
    评论:
    安全校验码:
    请在此处输入图片中的数字
    The Captcha image
    Terms & Conditions    Privacy Policy    Political ADs    Activities Agreement    Contact Us    Sitemap    

    加西网为北美中文网传媒集团旗下网站

    页面生成: 0.0313 秒 and 5 DB Queries in 0.0016 秒