T
traeai
登录
返回首页
量子位

难上热搜的高考数学,我拿ChatGPT和豆包PK了一把!

6.9Score

TL;DR · AI 摘要

难上热搜的高考数学,我拿ChatGPT和豆包PK了一把! – 量子位 扫码关注量子位 <div class="top search" <form role="search" method="get" class="search-form"...

核心要点

  • 主题聚焦:难上热搜的高考数学,我拿ChatGPT和豆包PK了一把!
  • 来源:量子位,建议结合原文判断细节。
  • AI 分析暂不可用,本条为保底评分与摘要。
#AI#编程#后端#产品
打开原文

难上热搜的高考数学,我拿ChatGPT和豆包PK了一把! – 量子位

扫码关注量子位

<div class="top_search"> <form role="search" method="get" class="search-form" action="https://www.qbitai.com/" id="search"> <label> <input type="search" class="search-field" placeholder="搜索…" value="" name="s"> </label> <button type="submit" class="search-submit"></button> </form> </div>

< img id="wx_img" src="https://www.qbitai.com/wp-content/uploads/imgs/qbitai-logo-1.png" width="400" height="400">

articlead begin

articlead end

难上热搜的高考数学,我拿ChatGPT和豆包PK了一把!

十三

2026-06-08

16:28:48

来源:

量子位

摘要样式

豆包硬刚ChatGPT

金磊 发自 凹非寺 量子位 | 公众号 QbitAI

今年 高考数学 ,又把不少人做沉默了。

从考场出来后,很多考生的第一反应不是有几道题不会,而是 怎么每一道都这么能算 。

于是乎,计算量大、题型新、区分度高,成了这张卷子被讨论最多的几个关键词。

更有意思的是,另一个问题也被顺手推上了台面:

如果把这张卷子交给AI,它到底会不会做?

我们平时会看到有些网友吐槽,AI在计算一些简单问题时会出错,怎么能答对从没见过的新高考题?

但这里有一个容易被忽略的细节,很多吐槽针对的是默认的快速模式,适合日常问答;而复杂数学、逻辑推理、编程分析这类任务,真正的打开方式应该是让模型深度思考。

所以这次,我们把问题拆开看。

同一张高考数学卷,分别交给 豆包思考模式 和 ChatGPT(GPT-5.5) ,按照教育场景常用的 图像输入 进行测试,结果会怎样?

先说结论。

豆包思考模式和ChatGPT都能给出相当稳定的解题表现。尤其是在需要多步推理、函数分析、概率建模、解析几何计算的题目上,AI已经可以按照人类解题路径一步步推进了。

AI们的答案汇总 如下:

(根据目前网传的试题和答案验证,豆包和ChatGPT在选择题和填空题上全都回答准确。解答题部分还需要专业老师评估过程分数。)

那么AI做高考数学,强在哪里?又容易卡在哪里?

我们继续往下看详细实测过程。

单选题:

前几道选择题看起来很基础,但并不等于机械计算。

比如第1题,中位数;第2题,平面向量线性表示;第3题,三角函数值与集合交集;第4题,导数与切线方程。

这些题人类考生做起来不算特别难,但对AI来说,其实会同时考几个能力:

读懂题干,识别考点,调用公式,完成计算,还要避免在最后一步把选项看错。

到了后面,题目明显开始拉开梯度。

比如抛物线焦点距离、函数最大值反推参数、古塔排列中的等差数列分组、空间点集里的数学期望。

接下来,我们分别给 豆包 思考模式和 ChatGPT ,每个题单独截图输入,并附上简单一句“解答这道题”。

第一题:

豆包和ChatGPT答案如下:

这道题比较简单,豆包和ChatGPT从思路和答案上来看,没有任何问题。

第二题:

两者都抓住了“向量a、b不共线”这一关键条件,转化为对应系数相等。整体看,这类题对当前头部AI难度不高。

第三题 :

这题容易错在特殊角的符号上,豆包和ChatGPT都逐项计算后再取交集,思路比较规范。差异主要在表述详略,结论一致。

第四题:

两者都准确完成了求导、代入斜率、写切线方程三步,没有把函数值和导数值混淆。作为导数基础题,表现稳定。

第五题:

这题开始要求先由点确定抛物线参数,再转为焦点坐标求距离。豆包和ChatGPT都能把计算链条走完,说明基础解析几何能力比较扎实。

第六题:

相比前几题,这道题需要把“最大值为1”转化成参数约束。两者都能给出完整推导,但这类题也更能暴露中间计算是否严谨。

第七题:

这题的难点在于先把“一百零八塔”的情境转成数列条件。豆包和ChatGPT都能识别等差结构并构造分组,说明对中文长题干的理解较稳。

第八题:

关键点在于样本空间删去了P(1,1,1),不能直接套“对称所以期望为0”。两者都抓住了删点带来的扰动,这是本轮测试里比较有代表性的推理点。

多选题:

第九题:

多选题不能只算一个结论,必须逐项验证。豆包和ChatGPT都对共轭、模长、平方和复数除法分别判断,整体比较细。

第十题:

空间几何多选题对直觉判断并不友好,两者都倾向于通过坐标或几何约束逐项排除。ChatGPT的排除过程更直接,豆包的推导更展开。

第十一题:

这一题对圆与直线交点条件的拆解要求较高,两者在部分选项判断上出现了差异。这里也提醒我们,多选综合题仍需要结合标准答案做人工核验。

填空题:

第十二题:

填空题没有选项兜底,两者都能把双曲线化为标准形式,并通过a、b、c关系求离心率。结论形式虽可等价变化,但核心计算一致。

第十三题:

这题同时考奇偶性和单调性,需要先锁定参数范围再计算函数值。豆包和ChatGPT都能沿着性质推导,思路比较完整。

第十四题:

数列构造题的难点在于从条件中抽出可用规律,而不是直接代公式。两者都尝试先求连续三项和,再分析等比关系,推理链条较长但方向清楚。

解答题:

第十五题:

立体几何证明题里,坐标法能显著降低想象难度。两者都选择建立坐标系推进证明和距离计算,适合展示AI处理几何综合题的过程能力。

第十六题:

这题把三角形边角关系和后续几何条件连在一起。两者都先用余弦定理处理基础量,再进入坐标化求解,整体策略比较稳。

第十七题:

概率题最容易错在“停止规则”,尤其是最后一次投篮既可能投中,也可能一直未中。两者都能把边界情况纳入分布列,处理得比较细。

第十八题:

椭圆题对计算量和几何关系都有要求,模型需要在方程、交点、面积条件之间来回切换。两者都给出了长链条推导,但压轴题仍建议人工复核关键代数步骤。

第十九题:

最后一题更接近函数逻辑证明,重点不只是算出结果,还要把包含关系、单调性和条件推演讲清楚。AI能给出完整证明框架,但严谨性仍需要逐步检查。

这次高考数学实测,真正说明了什么?

把这轮实测放在一起看,一个变化很明显:

AI做高考数学的讨论,已经从会不会算转向 能不能稳定读题、拆条件、验步骤 。

选择题里,它要避免粗心;多选题里,它要逐项判断;填空题里,没有选项提示,最终答案必须自己算出来;到了大题,模型还要把证明过程讲清楚。这些能力叠在一起,才更接近真实的数学推理。

这也解释了为什么同一个产品里,快速模式和思考模式会给人完全不同的感受。前者适合日常问答,追求快;后者面对复杂数学题时,会花更多时间展开推理、检查条件、组织步骤。拿快速模式去代表一个AI产品的复杂推理上限,结论很容易失真。

当然,AI现在还不应该被当成永远正确的答案机。尤其是多选综合题、压轴解析几何、函数证明这类长链条任务,任何一步计算或条件理解出错,后面都可能一路错下去。

更稳妥的用法,是把它当成一个高质量解题陪练:先帮你拆题,再帮你核对思路,最后提醒哪些步骤最容易出问题。

从这个意义上说,高考数学实测的价值不只是看豆包和ChatGPT谁多做对一道题。它更像一次公开压力测试:

当题目足够标准、评分足够严苛、推理链条足够长,AI到底能不能在中文数学场景里稳定工作。至少从这轮表现看,头部AI已经具备相当强的高考数学解题能力;但越到复杂题,越需要人和AI一起做校验。

一句话,AI已经能做很多高考数学题;接下来更重要的问题,是我们怎么把它用成学习工具,而不是简单的抄答案工具。

版权声明

版权所有,未经授权不得以任何形式转载及使用,违者必究。

ChatGPT

豆包

高考数学

作者文章列表

  • 扣子3.0实测:手机就能远程遥控你电脑里的Agent 2026-06-04
  • 今天起,无限期免费!全球首个全模态API开放,Top 10 AI Lab出手 2026-06-01
  • 国产GPU开始造世界!国内首个全栈具身智能仿真平台来了 2026-05-19
  • 刚刚,国产AI自己造了AI,全球首例! 2026-05-26

左侧分享

扫码分享至朋友圈

相关阅读 start

相关阅读

#### 文心一言APP国区可下载!免费体验120+玩法,PPT大纲Excel公式一键生成

马斯克、甄嬛专区亮了

2023-07-04

AIGC

文心一言

百度

#### 谷歌加紧测试ChatGPT竞品,靠对话可搜最新信息

这回是真急了。

韩智

2023-02-02

Apprentice Bard

谷歌

#### ChatGPT再进化!全工具All in One,网友:多少创业项目死于今天

最新支持PDF上传分析

明敏

2023-10-30

OpenAI

#### ChatGPT变笨新解释:世界被AI改变,与训练时不同了

可能没有少样本能力?

梦晨

2024-01-01

#### 实测ChatGPT最强插件:0经验5分钟开发游戏

贪吃蛇、别踩白块都能做

克雷西

2023-07-12

#### 安卓版ChatGPT要来了!

可以预注册了

2023-07-22

Android

安卓

相关阅读 end

热门文章 start

热门文章

#### 今天起,无限期免费!全球首个全模态API开放,Top 10 AI Lab出手

2026-06-01

#### WPS笔记正式发布:AI贯穿记录、整理与复用全过程

2026-06-05

#### 100亿砸向人形,不如先让10万台机器狗走进家庭

#### 近2亿美元!VAST完成新一轮融资,正式披露世界模型路线

#### Qwen3.7-Plus上线!多模态智能体新基座,一键复刻桌面端专业软件

2026-06-02

<form role="search" method="get" class="search-form" action="https://www.qbitai.com/"> <label> <span class="screen-reader-text">搜索:</span> <input type="search" class="search-field" placeholder="搜索…" value="" name="s" /> </label> <button type="submit" class="search-submit"><span class="screen-reader-text">搜索</span></button> </form>

热门文章 end

底部版权

  • 关于量子位
  • 加入我们
  • 寻求报道
  • 商务合作

<a href="/?page_id=183"target="_blank"><i class="weixin_icon"></i></a>

追踪人工智能新趋势,报道科技行业新突破

<p>量子位 QbitAI 版权所有©北京极客伙伴科技有限公司 京ICP备17005886号-1</p>

量子位 QbitAI 版权所有©北京极客伙伴科技有限公司 京ICP备17005886号-1

AI 可能会生成不准确的信息,请核实重要内容

难上热搜的高考数学,我拿ChatGPT和豆包PK了一把! | 量子位 | traeai