| 广告联系 | 繁体版 | 手机版 | 微信 | 微博 | 搜索:
欢迎您 游客 | 登录 | 免费注册 | 忘记了密码 | 社交账号注册或登录

首页

新闻资讯

论坛

温哥华地产

大温餐馆点评

温哥华汽车

温哥华教育

黄页/二手

旅游

"AI登月时刻",OpenAI模型摘取奥数金牌

QR Code
请用微信 扫一扫 扫描上面的二维码,然后点击页面右上角的 ... 图标,然后点击 发送给朋友分享到朋友圈,谢谢!
OpenAI的一个通用推理模型,在刚结束的国际奥林匹克数学竞赛(IMO)中达到了金牌的水平。AI登月时刻,社交媒体一夜无眠,AI圈子沸腾了。


在与人类参赛者完全相同的规则下,OpenAI的模型挑战了2025年IMO试题:两场各4.5小时的考试、禁用任何工具和互联网、只能阅读官方题面并以自然语言撰写完整证明。模型完整解出了6题中的5题。每道题都由三位前IMO奖牌得主独立批改,并在取得一致意见后定分。最终模型拿到35/42分——足以摘金!

重大意义在于,这是一个通用推理模型,而不是一个专门用来解数学题的专门系统,也没有经过验证的奖励信号,即它不是依赖于“有标准答案、实时打分的奖励”来学会的,而是靠更通用的推理和新技术,在长时间复杂的过程中,做出了正确的推理和证明。


OpenAI证明,尽管经历了Meta疯狂的挖角,它依然保持了顶尖研究人才的密度,做出重大的研究突破。本周OpenAI的模型o3 alpha在AtCoder世界巡回赛2025决赛中仅逊于人类编程奇才Psyho,获得第二名;测试中强于o3 pro,是最好的编程及物理模型。

这样,OpenAI目前拥有了最强的编程及数学模型,让它再次碾压DeepMind,Anthropic,Grok等,也再次与中国引领的开源模型拉开了差距。

实际上,OpenAI内部正在测试一个全新的推理模型,取得奥数金牌成绩,仅是其一次小试牛刀。它的正式发布甚至会在GPT-5之后,预计是今年底。OpenAI推理研究的科学家Alexander We负责这个模型项目,他首先宣布了这一消息,并顺带提及GPT-5发布在即。

这是一件大事,我们可以说它让成为AGI迈向ASI的新起点吗?Alexander Wei发了一组帖文说明它的意义:

“第一,IMO题目对“持续创造性思考”提出了前所未有的要求。从推理时间跨度来看,我们已经一路从GSM8K(顶尖人类约0.1分钟)→MATH数据集(约1分钟)→AIME(约10分钟)→IMO(约100分钟)。

第二,IMO答案往往是长达数页、难以验证的证明。要想在这一关取得进展,就必须跳出传统强化学习“奖励信号清晰、易于验证”的范式。我们做到了——由此得到的模型能够在复杂度和严谨性上匹敌人类数学家。


除了结果本身,我更兴奋的是方法:我们并未依赖狭窄的、任务特化的技巧,而是通过通用强化学习与“测试时计算”扩展的新突破,才达到这一水准。”

这项成就,在OpenAI内部被认为是实现了急需的一次研究上的突破,“Alex Wei做到了。”它几乎没有针对IMO做任何专项工作,只是持续训练通用模型;所有证明均为自然语言撰写,没有使用任何定制化的评测框架。

这个模型的尺寸仍然是个谜,不过OpenAI的团队成员透露,所用的算力相当有限,因为星际之门还没有投入使用。


OpenAI科学家Sebastined Bubeck称之为AI的“登月时刻”。简单讲:一个只是预测下一个词的机器(真的是啥工具都没用)刚刚给出了几个又难又新的数学题的创造性证明,这种水平平时也只有少数天才少年能做到。



OpenAI的首席研究官Mark Chen曾经担任美国国际奥林匹克信息竞赛的教练,他认为:“不同于以往比赛中用的那些狭窄的系统,我们的模型具备更广泛的推理能力,远远超越了竞赛题的范围。”

他指的是谷歌的AlphaProof在去年的奥数赛中,解出了6道题中的4道。

解决了奥数金牌的问题,接下来就是人类真正待解的难题了。在OpenAI多智能体组的研究员Sheryl Hsu参与了这个项目,她激动地说,从起步到达到奥数金牌水平,仅用了15个月,照这个速度下去,明年就可以用来产生数学定理和用全新方法进行数学研究了。
您的点赞是对我们的鼓励     还没人说话啊,我想来说几句
上一页123下一页
注:
  • 新闻来源于其它媒体,内容不代表本站立场!
  • 在此页阅读全文
    猜您喜欢:
    您可能也喜欢:
    我来说两句:
    评论:
    安全校验码:
    请在此处输入图片中的数字
    The Captcha image
    Terms & Conditions    Privacy Policy    Political ADs    Activities Agreement    Contact Us    Sitemap    

    加西网为北美中文网传媒集团旗下网站

    页面生成: 0.0307 秒 and 5 DB Queries in 0.0013 秒