2025年高考刚刚落下帷幕,考生们还在紧张等待成绩。人工智能的“考生”们交出的答卷也成为社会和技术领域的关注热点。
在高考中,数学则是最能体现大模型推理能力的学科。以教育垂类最有代表性的大模型为例,用学而思旗下的九章大模型针对2025年高考数学全国卷(Ⅰ卷、Ⅱ卷)的选择题和填空题进行测试,结果显示:在Ⅰ卷的14道选择填空题中,九章大模型答对12道;在Ⅱ卷的14道选择填空题中,更是全部答对,展现出强大的逻辑推理和数学计算能力。
值得说明的是,测试聚焦于选择题和填空题,这两类题型有明确的客观答案,便于评估AI的准确率;而解答题、证明题涉及步骤分、逻辑表述等主观评分因素,对于AI输出结果的判断存在差异,因此未纳入本次测试范围。
正确率超90%,AI得分能超不少考生
整体情况如图,在两套全国试卷中的28道选择题中,九章大模型做错了全国Ⅰ卷的6、9两题,在共28道主观题当中,共做对26题,整体正确率约93%。
值得一提的是,单选、多选的最后一题一般为该题型下最难的题目,大模型也都顺利完成了思考和计算,给出正确答案:
正确率高,教育大模型的“解题规范”也在提升
除了答题正确率,九章大模型在公式书写规范性、解题思路清晰度等方面也表现优异。
以文本输出见长的大模型,在面对数学公式、特殊符号的表达时,往往会采用"代偿性表述"——例如用"a的平方加b的平方"代替"a²+b²"。而九章大模型作为教育垂类专用模型,其训练数据中包含了大量教材、教辅资料的专业表达,使得它在输出时能直接使用数学符号。
这种专业性的背后,是模型对教育场景的深度适配。九章大模型在解答后会附加"考点分析"和"易错点提示”,这种结合知识图谱的结构化输出,更接近学生和老师使用大模型辅助学习的真实场景。教育领域的AI不仅要"做对题",更要"讲好题",更可以实现根据学生薄弱点,针对性地讲题、训练的“精准学”。
AI如何赋能教育?专家:目前更适合做“超级辅导老师”
大模型在高考解题上表现出色,但AI的价值当然不是“高考刷分”,而是利用AI技术更好地赋能学习场景。
专家认为,目前大模型在限定领域的客观题上表现优秀,但在开放性、创造性题目上仍有很大空间。现阶段AI赋能教育的体现,更多是在对老师的教学辅助和对学生的个性化学习辅导上。
随着大模型的数据挑战结果不断突破,教育智能化趋势加速。随着大模型产品进一步优化模型在复杂推理、多模态交互等方面的能力,“答题工具”向“学习伙伴”也将加速实现。
声明:本站转载此文目的在于传递更多信息,并不代表赞同其观点和对其真实性负责。如涉及作品内容、版权和其它问题,请在30日内与本网联系,我们将在第一时间删除内容,本网站对此声明具有最终解释权。