-
日期: 2025-11-15 | 来源: 自由时报 | 有0人参与评论 | 专栏: 韩国 | 字体: 小 中 大假设AI是一名参加大学入学考试的学生,它会得到怎样的成绩呢?韩联社与延世大学教授金时浩(김시호)的研究团队合作,使用ChatGPT(GPT-5)、Gemini(2.5Flash)、Perplexity(Sonar)的免费版本以及DeepSeek的最新模型,挑战测验2026年韩国大学入学考试(대학수학능력시험,简称CSAT)的韩语、英语与数学。
根据《韩联社》 报道,研究团队让4款热门AI参加大考,实测如果这些人工智慧是真正的考生,它们可能会就读哪些大学。为了确保测试环境与考试规定和韩国大学入学考试相同,所有的AI禁止搜寻网络,并被要求自行解决问题。
在测试中获得第一名高分的模型是ChatGPT,尤其“数学”表现出色,尽管今年的数学题目,因穿插了大量高难度题目而被评为难度较高的考科,但ChatGPT仍然取得了优秀成绩。
第二高分则是DeepSeek,它在韩语和英语方面的得分高于GPT,但由于其数学得分较低,导致其总分下降。
Gemini在数学方面表现出了较高的准确率,与ChatGPT类似,但可惜其韩语得分垫底。
而整体得分最低的是Perplexity,测试过程中经常出错,例如在测试过程中突然拒绝回答,而且难以准确测量测试时间,此外,还违反CSAT考试规定,像是在考试期间上网搜寻资讯。
金时浩(김시호)教授表示:“尽管人工智慧模型取得了显著进步,但它们在韩语的表现仍然不尽如人意,似乎无法解决我们所设想的高层次问题”。
ChatGPT在研究中赢得韩国大学入学考试的最高分。示意照。(美联社)- 新闻来源于其它媒体,内容不代表本站立场!
- 韩国刚承诺多买美国武器,转头豁免待遇没了
- 中国足球击败韩国足球 韩媒:前所未有的耻辱
- 美国卷大规模裁员潮 可怕时刻未到
- 强地磁风暴 大温今夜或现极光盛景
- 金鸡奖红毯生图来了!谁的状态最好
-
- 环球小姐佳丽集体退赛:选美史上最震撼溃败!
- 宇航员安全返回,中国的太空救援开始了
- 急诊室等20小时 才得知需紧急手术
- 嫌犯驾车冲破Lansdowne商场入口
- 温哥华资深地产经纪 工作诚信认真
- 罕见 海豹成群结队地涌向大温海边
-
- 800年来第一个访华的泰国国王,这是干嘛来了?
- 大温这城市48小时就有5人被车撞伤
- 导演陈可辛出车祸,现场画面曝光,警方正调查
- 传通用要求制造商将供应链从中国撤出
- 男子偷开有客的加国公车 行为惊人
- 列市农场主怒斥暗箱操作 忽视私产
-
- 卡尼宣布第2批七个重大建设项目
- 重大突破 解密福建舰电磁弹射背后的硬核支撑
- 当局误判病情 BC妈妈苦等救命手术
- 百姓身边八件"破事" 看透中国经济真貌
- 温哥华会计事务所 收费低 服务好
- 解放军报:若武力介入台海 日本全国或沦为战场
-
目前还没有人发表评论, 大家都在期待您的高见
