> 自媒体 > (AI)人工智能 > 难上热搜的高考数学,我拿ChatGPT和豆包PK了一把!
难上热搜的高考数学,我拿ChatGPT和豆包PK了一把!
来源:量子位
2026-06-10 16:10:51
71
管理

金磊 发自 凹非寺

量子位 | 公众号 QbitAI

今年高考数学,又把不少人做沉默了。

从考场出来后,很多考生的第一反应不是有几道题不会,而是怎么每一道都这么能算。

于是乎,计算量大、题型新、区分度高,成了这张卷子被讨论最多的几个关键词。

更有意思的是,另一个问题也被顺手推上了台面:

如果把这张卷子交给AI,它到底会不会做?

我们平时会看到有些网友吐槽,AI在计算一些简单问题时会出错,怎么能答对从没见过的新高考题?

但这里有一个容易被忽略的细节,很多吐槽针对的是默认的快速模式,适合日常问答;而复杂数学、逻辑推理、编程分析这类任务,真正的打开方式应该是让模型深度思考。

(根据目前网传的试题和答案验证,豆包和ChatGPT在选择题和填空题上全都回答准确。解答题部分还需要专业老师评估过程分数。)

那么AI做高考数学,强在哪里?又容易卡在哪里?

我们继续往下看详细实测过程。

单选题:

前几道选择题看起来很基础,但并不等于机械计算。

比如第1题,中位数;第2题,平面向量线性表示;第3题,三角函数值与集合交集;第4题,导数与切线方程。

这些题人类考生做起来不算特别难,但对AI来说,其实会同时考几个能力:

读懂题干,识别考点,调用公式,完成计算,还要避免在最后一步把选项看错。

到了后面,题目明显开始拉开梯度。

比如抛物线焦点距离、函数最大值反推参数、古塔排列中的等差数列分组、空间点集里的数学期望。

接下来,我们分别给豆包思考模式和ChatGPT,每个题单独截图输入,并附上简单一句“解答这道题”。

第一题:

两者都抓住了“向量a、b不共线”这一关键条件,转化为对应系数相等。整体看,这类题对当前头部AI难度不高。

第三题:

豆包和ChatGPT答案如下:

这题容易错在特殊角的符号上,豆包和ChatGPT都逐项计算后再取交集,思路比较规范。差异主要在表述详略,结论一致。

第四题:

豆包和ChatGPT答案如下:

豆包和ChatGPT答案如下:

这题开始要求先由点确定抛物线参数,再转为焦点坐标求距离。豆包和ChatGPT都能把计算链条走完,说明基础解析几何能力比较扎实。

第六题:

豆包和ChatGPT答案如下:

多选题不能只算一个结论,必须逐项验证。豆包和ChatGPT都对共轭、模长、平方和复数除法分别判断,整体比较细。

第十题:

豆包和ChatGPT答案如下:

填空题没有选项兜底,两者都能把双曲线化为标准形式,并通过a、b、c关系求离心率。结论形式虽可等价变化,但核心计算一致。

第十三题:

这题同时考奇偶性和单调性,需要先锁定参数范围再计算函数值。豆包和ChatGPT都能沿着性质推导,思路比较完整。

第十四题:

豆包和ChatGPT答案如下:

椭圆题对计算量和几何关系都有要求,模型需要在方程、交点、面积条件之间来回切换。两者都给出了长链条推导,但压轴题仍建议人工复核关键代数步骤。

第十九题:

豆包和ChatGPT答案如下:

最后一题更接近函数逻辑证明,重点不只是算出结果,还要把包含关系、单调性和条件推演讲清楚。AI能给出完整证明框架,但严谨性仍需要逐步检查。

这次高考数学实测,真正说明了什么?

把这轮实测放在一起看,一个变化很明显:

AI做高考数学的讨论,已经从会不会算转向能不能稳定读题、拆条件、验步骤。

选择题里,它要避免粗心;多选题里,它要逐项判断;填空题里,没有选项提示,最终答案必须自己算出来;到了大题,模型还要把证明过程讲清楚。这些能力叠在一起,才更接近真实的数学推理。

这也解释了为什么同一个产品里,快速模式和思考模式会给人完全不同的感受。前者适合日常问答,追求快;后者面对复杂数学题时,会花更多时间展开推理、检查条件、组织步骤。拿快速模式去代表一个AI产品的复杂推理上限,结论很容易失真。

当然,AI现在还不应该被当成永远正确的答案机。尤其是多选综合题、压轴解析几何、函数证明这类长链条任务,任何一步计算或条件理解出错,后面都可能一路错下去。

更稳妥的用法,是把它当成一个高质量解题陪练:先帮你拆题,再帮你核对思路,最后提醒哪些步骤最容易出问题。

从这个意义上说,高考数学实测的价值不只是看豆包和ChatGPT谁多做对一道题。它更像一次公开压力测试:

当题目足够标准、评分足够严苛、推理链条足够长,AI到底能不能在中文数学场景里稳定工作。至少从这轮表现看,头部AI已经具备相当强的高考数学解题能力;但越到复杂题,越需要人和AI一起做校验。

一句话,AI已经能做很多高考数学题;接下来更重要的问题,是我们怎么把它用成学习工具,而不是简单的抄答案工具。

— 完 —

量子位 QbitAI · 头条号

关注我们,第一时间获知前沿科技动态

0
点赞
赏礼
赏钱
0
收藏
免责声明:本文仅代表作者个人观点,与本站无关。其原创性以及文中陈述文字和内容未经本网证实,对本文以及其中全部或者 部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。 凡本网注明 “来源:XXX(非本站)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对 其真实性负责。 如因作品内容、版权和其它问题需要同本网联系的,请在一周内进行,以便我们及时处理。 QQ:617470285 邮箱:617470285@qq.com
相关文章
女生深夜想找人聊天安全吗?5个正规陪聊平台实测推荐..
深夜失眠,你是否也渴望一个安全的倾诉出口?凌晨两点,翻来覆去睡不着。..
不折腾也能用上 ChatGPT:普通人低成本体验 AI 的实战路线..
最近很多朋友问我:在国内想用 ChatGPT,有没有不折腾、成本低、上手快的..
Sensor Tower:OpenAI旗下ChatGPT月活已破10亿,史上最快
IT之家 6 月 3 日消息,市场情报机构 Sensor Tower 估计,OpenAI 旗下 Ch..
ChatGPT 推出「成人模式」之前,AI 已经在颠覆这门生意..
不仅要抢好莱坞女演员的饭碗,AI 现在还要取代 P 站演员的工作。《经济学..
ChatGPT流量占比腰斩 AI行业格局彻底重构
Similarweb发布的最新流量数据显示,AI聊天机器人赛道正在发生肉眼可见的..
别再用ChatGPT聊天了,AI已经悄悄换了玩法
别再用ChatGPT聊天了,AI已经悄悄换了玩法你还在跟AI聊天?说实话,这事..
NBA Chat正式上线:千问大模型赋能,NBA官方AI助手
PChome 6月5日消息,NBA中国与阿里巴巴联合宣布,基于阿里千问大模型打造..
Siri将迎历史性升级!iOS 27推出独立应用,功能全面对标ChatGPT..
来源:环球网 【环球网科技综合报道】3月25日消息,据彭博社报道,苹果正..
人工智能冲击ChatGPT诞生前的一代初创企业
来源:环球市场播报核心要点市场研究机构 PitchBook 的数据显示,美国 85..
关于作者
冷熙(普通会员)
文章
1990
关注
0
粉丝
0
点击领取今天的签到奖励!
签到排行

成员 网址收录40418 企业收录2986 印章生成263660 电子证书1157 电子名片68 自媒体112950

0
0
分享
请选择要切换的马甲:

个人中心

每日签到

我的消息

内容搜索