如何看待机器之心重测高考数学全卷，Gemini夺冠，豆包DeepSeek并列第二？

发布日期：2025-06-23 05:30:10 浏览次数：0次

当务之急最该解决的问题是大众对于 AI大模型的正确认知以及最基本的AI用法。

你看这是前两天的测试结果，突出了一个政治正确，6款大模型，OpenAI的o3倒数第一，我当时看到的时候就觉得很奇怪，o3好歹也是曾经的一代王者，高考数学这种题它排名这么低怕不是有什么猫腻。

我们就拿单选题的第五题来测试下，因为这道题除了o3，其他的国产模型都答对了。

这是第五题的原题，正确答案是A. - 1/2。

这是之前的第三方的测试结果，6个模型…。

如何看待机器之心重测高考数学全卷，Gemini夺冠，豆包DeepSeek并列第二？

上一篇 : 你见过最无用的节俭行为是什么？下一篇 : 微软升级自研AI芯片减少对英伟达依赖，号称吊打亚马逊Trainium、超越谷歌TPU_Maia_模型_服务

热点新闻

巨亏21亿！“胖东来之子”崩了_永辉超市_门店_员工

有“搭子”的年轻人，为何还是怕“死了没人知道”_App_赵梦晗_死亡率

从“0”到“100000”：一个软文营销案例的神奇之旅 - *

为什么拼音26键没有ü?

有哪些小众的开源项目养活了一大批人?

手机厂商集体破防：这届新品为何不涨不行？_成本_消费者_存储

华为神秘新机曝光：白绿橘蓝黑五色可选，或为全球首款折叠平板！_Pura_概率_屏幕

2026春晚，大模型的分水岭_字节_红包_用户

疯了！孙宇晨出价3000万美元，只为跟马斯克独处1小时_加密_巴菲特_公众

“中国最有钱的三个男人”，正为豆包疯狂开战_手机_字节_用户

联系我们

电话：

座机：

邮箱：

地址：