| 广告联系 | 繁体版 | 手机版 | 微信 | 微博 | 搜索:
欢迎您 游客 | 登录 | 免费注册 | 忘记了密码 | 社交账号注册或登录

首页

新闻资讯

论坛

温哥华地产

大温餐馆点评

温哥华汽车

温哥华教育

黄页/二手

旅游

AI理科碾压人类状元 却被这道文科题戳中了死穴


请用微信 扫一扫 扫描上面的二维码,然后点击页面右上角的 ... 图标,然后点击 发送给朋友分享到朋友圈,谢谢!
谁敢信?日本(专题)最难考的顶尖学府——东京大学和京都大学,刚刚被AI实现了突破。


不仅是考上,成绩还大幅领先。

在LifePrompt公司和日本老牌补习机构“河合塾”搞的一场闭卷盲测中,OpenAI的最新大模型ChatGPT 5.2 Thinking,大幅领先人类顶尖考生。


但值得注意的是。

在翻看这份成绩单时,我们发现了一个AI得分率仅为25%的“显着薄弱环节”。

这个大坑,或许恰好是当代高考生和准大学生们的“核心竞争力所在”。

多考50分,数学拿满分先来看一眼这份成绩单。

这可不是开卷考试。测试全程物理断网,AI只能凭自己的“脑力”(预训练权重)硬做。

结果呢?

在号称日本地狱级难度的东大理科三类(医学部)考试里,满分550分,ChatGPT 5.2拿了503分。

作为参照,今年考上这个专业的人类最高分,仅仅是453分。

整整高了50分!

更值得注意的是,它的数学直接拿了满分,英语得分率也稳稳踩在90%的基准线上。

京都大学同样取得了突破性成绩。在医学部考试中,AI获得1176分,把人类状元的1098分远远甩在身后。

要知道,AI进化速度令人瞩目。

回看2024年,老前辈GPT-4在这套卷子面前未能通过所有科目,连最低录取线都没够到。

2025年,加了强化学习的o1模型终于首次达到录取合格线。

结果才过了一年,ChatGPT 5.2以最高分通过考试。

得分率25%的短板数学满分,英语90%,理应是无敌的存在了吧?

但是!


在这份优异的成绩单中,有一科的成绩明显不足——

世界史论述题,满分60,它只拿了15分,得分率仅为25%。

为何一个拥有庞大知识储备、数学能力极强的模型,会在文科论述题上表现明显不佳?

阅卷的河合塾老师和技术社区的专家们给出了答案:因为这届AI,严重缺乏结构化组织能力(Structural organization)。

世界史论述题可不是背年份填空。

它需要你把历史长河里的碎片串起来,理出政治和经济的因果,写出一篇逻辑严密、首尾呼应的大文章。

一句话:需要人类的“宏大叙事”。


而这,恰恰是大模型目前的死穴。

当让它写上千字长文时,它写着写着就偏离了主题。

开发者社区做过极端测试:如果让现在的AI去维持一个超长文本的“连贯思想主线”,往往在几轮逻辑转折后,它就开始出现结构性断裂(Structural collapse)。

更要命的是,在处理极度复杂的宏大卷宗时,它还可能遭遇“长期记忆坍缩”,上下文丢失,逻辑线瞬间重置。

也就是说,目前的大模型依然缺乏全局架构能力。

它写出来的东西,单看每一句辞藻都很华丽;但拼在一起,整体缺乏逻辑连贯性,完全没有人类统领全局的“世界观”。

大学生的“反击指南”看懂了这个25%的软肋,高考生和准大学生的破局方向也就清晰了。

日本人工智能学会会长Satoshi Kurihara教授说得好:人类绝对不该在同一条赛道上与AI直接竞争。

打个比方,你非要跟计算器比算数快,这显然不是明智之举。

在AI轻松超越人类顶尖理科考生的时代,准大学生们的技能树,必须得换个点法了:

第一,减少对“规则内机械做题”的依赖。

不管你微积分算得多快,法条背得多熟练,你都拼不过几美分调用一次的API接口。

靠疯狂刷题、机械记忆去换取职场高薪的路线,正在急速贬值。果断把你的时间精力,从纯粹的“拼记忆、拼算力”里抽离出来。
您的点赞是对我们的鼓励     还没人说话啊,我想来说几句
上一页12下一页
注:
  • 新闻来源于其它媒体,内容不代表本站立场!
  • 在此页阅读全文
    猜您喜欢:
    您可能也喜欢:
    我来说两句:
    评论:
    安全校验码:
    请在此处输入图片中的数字
    The Captcha image
    Terms & Conditions    Privacy Policy    Political ADs    Activities Agreement    Contact Us    Sitemap    

    加西网为北美中文网传媒集团旗下网站

    页面生成: 0.0440 秒 and 5 DB Queries in 0.0036 秒