如何看待机器之心重测高考数学全卷,Gemini夺冠,豆包DeepSeek并列第二?
- 发表时间:2025-06-20 19:05:16
- 来源:
当务之急最该解决的问题是大众对于 AI大模型的正确认知以及最基本的AI用法。
你看这是前两天的测试结果,突出了一个政治正确,6款大模型,OpenAI的o3倒数第一,我当时看到的时候就觉得很奇怪,o3好歹也是曾经的一代王者,高考数学这种题它排名这么低怕不是有什么猫腻。
我们就拿单选题的第五题来测试下,因为这道题除了o3,其他的国产模型都答对了。
这是第五题的原题,正确答案是A. - 1/2。
这是之前的第三方的测试结果,6个模型…。
推荐资讯
- 2025-06-20 10:50:19身体上的哪些迹象表明你正在衰老?
- 2025-06-20 11:05:18如何看待 Rust 的应用前景?
- 2025-06-20 11:05:18大家支不支持文言文,古文退出中国教育?
- 2025-06-20 10:20:18伊朗是不是应该该考虑购买中国的雷达、预警机和J10c了?
- 2025-06-20 10:35:18Gemini 2.5 Flash 和Pro稳定版上线,和之前版本相比,在性能和应用场景上有哪些提升?
- 2025-06-20 11:10:22鱼缸里突然在水面角落出现很多想泡沫一样的气泡是怎么回事?
- 2025-06-20 10:25:19现在是2025年6月,现在的房价是阴跌还是暴跌?还会继续跌多久?是否已经开始分化?
- 2025-06-20 11:35:19为什么不用rust重写Nginx?
- 2025-06-20 10:40:19新手养鱼,养什么鱼好?
- 2025-06-20 09:50:16“哨兵模式”涉嫌泄密,你支持封杀特斯拉吗?
推荐产品
-
现在国内出现了很多 MCU 公司,CPU 使用的是 Cortex-M,但为何基本上都是模仿STM32?
Stm32的芯片架构不是ST开发的,而是从ARM公司手上买的 -
异性同办公室久了会不会日久生情?
我最近一年,因为有个项目,经常和一个女同事出差,我是产品,她 -
买到烂尾楼到底该有多绝望?
1 见过发短***维权的,也见过发短***擦边的。 这是第 -
你觉得最毁三观的事是什么?
1.天下之大,无奇不有。 近日某地男子抓到妻子偷情现场,妻子
最新资讯