如何看待机器之心重测高考数学全卷,Gemini夺冠,豆包DeepSeek并列第二?
- 发表时间:2025-06-21 09:15:16
- 来源:
当务之急最该解决的问题是大众对于 AI大模型的正确认知以及最基本的AI用法。
你看这是前两天的测试结果,突出了一个政治正确,6款大模型,OpenAI的o3倒数第一,我当时看到的时候就觉得很奇怪,o3好歹也是曾经的一代王者,高考数学这种题它排名这么低怕不是有什么猫腻。
我们就拿单选题的第五题来测试下,因为这道题除了o3,其他的国产模型都答对了。
这是第五题的原题,正确答案是A. - 1/2。
这是之前的第三方的测试结果,6个模型…。
推荐资讯
- 2025-06-21 06:25:16为什么女生要做大部分家务?
- 2025-06-21 06:00:15如何优雅劝退他人做自媒体?
- 2025-06-21 06:40:17为什么有的女生喜欢穿紧身牛仔裤?
- 2025-06-21 07:00:16如何评价《灵笼 2》第六集?
- 2025-06-21 06:20:15用J***a写Android的时代是不是要结束了?
- 2025-06-21 06:40:17组nas一定要TDP低的cpu吗?
- 2025-06-21 06:15:16有没有一款音乐播放器,能连接nas音乐,创建音乐库,自动匹配歌词封面等等?类似infuse的概念呢?
- 2025-06-21 07:05:16在韩国生活有什么体验?
- 2025-06-21 06:30:16Swift 和同时代的其他语言比起来怎么样?
- 2025-06-21 06:15:16如何看待伊朗发布10座美军基地地图?
推荐产品
-
橘猫为什么广受欢迎?
广西网友小刘想要收养楼下的流浪小橘猫,但是发现小橘的前腿断了 -
PHP现在真的已经过时了吗?
作为微小企业的技术面试官,负责后端技术招聘,结合公司实际业务 -
Postgres 和 MySQL 应该怎么选?
目前来看,主要指标pg全方位优于mysql... 本内容是对 -
Golang和J***a到底怎么选?
就不想用rust吗?局面打开,j***a写一堆class太臃
新闻动态
最新资讯