十家AI大模型高考作文评测:DeepSeek夺冠,Kimi不及格

当人工智能与高考作文相遇,结果如何?2025年全国高考语文考试结束后,十款常见AI大模型——DeepSeek、字节豆包、腾讯混元、阿里通义千问、百度文小言、讯飞星火、ChatGPT、谷歌Gemini、Kimi和智谱清言,根据全国一卷作文试题进行了写作。

经过多次参加高考语文阅卷的老师评分,DeepSeek以58分(满分60分)位居榜首,谷歌Gemini以56分紧随其后,通义千问获得50分。而Kimi仅得35分,被评价为“四个小标题画蛇添足,整篇文章有文字堆砌之感”。讯飞星火因举例不当得36分,腾讯混元虽表现不错但因出现幻觉被扣分。

值得注意的是,记者要求部分大模型为自己作文打分。DeepSeek给自己打了满分,而阅卷老师给出58分;谷歌Gemini自评为58分,并指出素材陈旧问题;Kimi拒绝为自己作文评分。

多位朋友认为,许多中学生难以写出如此表达整齐、逻辑清晰的文章。然而,阅卷老师指出,这些AI作文虽无错别字且结构工整,但缺乏烟火气,不够灵动,难以打动人心。

以下是部分AI作文内容:

DeepSeek的作文《暗处生光》强调,在困厄中灵魂表达更显珍贵,沉默并非失语而是另一种深沉表达。艾青的嘶哑歌声赋予生命真实质感,穆旦带血的拥抱象征民族不屈精神。

豆包的作文《以歌为刃,刺破时代的雾霭》从个体困境到民族觉醒,层次分明,但被认为文采稍欠。

腾讯混元的《血色长歌里的民族魂》通过历史扩展材料,但由于引用错误被扣分。

百度文心一言的《以歌为炬,照亮前行之路》采用排比形式阐释主题,但被认为有堆砌之感。

通义千问的《以嘶哑的喉咙歌唱》紧扣文化传承,将古代与现代连接,得到较高评价。

讯飞星火的《喑哑声中的觉醒之歌》因举例不当被批评,如嵇康事例使用错误。

ChatGPT 4o的《嘶哑也要歌唱,沉痛亦能拥抱》语言朴素,虽无明显错误但也缺乏亮点。

谷歌Gemini的《于苦难的土壤,开出精神之花》发挥给定材料,虽素材老套但阐释得当。

Kimi的《时代责任,吾辈担当》使用多个小标题,被认为不符合高考规范且堆砌文字。

智谱清言的《在困顿中高歌,于磨难里重生》论述清楚但缺乏文采,初次尝试时甚至拒绝写作任务。

免责声明:本文内容由开放的智能模型自动生成,仅供参考。

Copyright © DoNews 2000-2025 All Rights Reserved
蜀ICP备2024059877号-1