| Contact Us | CHT | Mobile | Wechat | Weibo | Search:
Welcome Visitors | 登录 | 免费注册 | 忘记了密码 | 社交账号注册或登录

Home

News

Forums

Realty

大温餐馆点评

Car

Education

Yellow Page

Travel

马斯克: 马斯克Grok 4强得可怕 一句话生成3D黑洞

QR Code
请用微信 扫一扫 扫描上面的二维码,然后点击页面右上角的 ... 图标,然后点击 发送给朋友分享到朋友圈,谢谢!
此前,在Grok 3上,xAI团队实现了将下一个token预训练扩展到前所未有的的规模。


并且,在开发Grok 3 Reasoning实践中,证明了接下来完全有可能大幅扩展强化学习的训练规模。

如今,Grok 4的诞生,恰恰证明了团队的方向是正确的。


整个技术栈的创新,让Grok 4训练计算效率暴涨了6倍。

与此同时,研究团队还开展了大规模数据收集工作,将可用于验证的训练数据从以数学、编程为主,扩展到了更多的领域。

不仅如此,Grok 4通过RL学会了使用原生工具,在代码解释器、网页浏览工具加持下,大幅提升了思考能力。

可以看到,在人类最后考试(HLE)上,Grok 4用上工具的得分刷爆SOTA,创下50.7%新纪录。



Grok 4 Heavy刷爆HLE


Grok 4 Heavy被称作是多智能体版,在Scaling测试时计算后,性能得到大幅提升。

一个模型,可以同时思考多种假设,最终汇总出一个可靠准确的答案。




在多项基准测试中,Grok 4系模型全部刷新了SOTA。

尤其是,在ARC-AGI V2上,它以15.9%的成绩碾压所有闭源顶尖模型,是Claude Opus 4的两倍。

在智能体 Vending-Bench基准测试中,Grok 4赚钱能力遥遥领先,远超所有模型和人类。



在IQ方面,Grok 4相对来说还是弱一些,在门萨智商测试中,拿下了136分,仅次于Claude 4。


觉得新闻不错,请点个赞吧     这条新闻还没有人评论喔,等着您的高见呢
Note:
  • 新闻来源于其它媒体,内容不代表本站立场!
  • _VIEW_NEWS_FULL
    _RELATED_NEWS:
    _RELATED_NEWS_MORE:
    _POSTMYCOMMENT:
    Comment:
    Security Code:
    Please input the number which is shown on the following picture
    The Captcha image
    Terms & Conditions    Privacy Policy    Political ADs    Activities Agreement    Contact Us    Sitemap    

    加西网为北美中文网传媒集团旗下网站

    Page Generation: 0.0500 Seconds and 3 DB Queries in 0.0009 Seconds