忘记密码?
其他方式登录

高考前一天,五个 AI 出了同一道作文题

2026年6月6日

1985 年,教育部高考语文研究组编了一本书,《全国高考作文评分系统与各类标准卷选》,那是一个关注语言水平、写作创造力和文字如何反映生活的时代,高考作文既是一种考察写作能力的方式,也是教书育人理念的延

详细介绍

1985 年,教育部高考语文研究组编了一本书,《全国高考作文评分系统与各类标准卷选》,那是一个关注语言水平、写作创造力和文字如何反映生活的时代,高考作文既是一种考察写作能力的方式,也是教书育人理念的延伸。

高考前一天,五个 AI 出了同一道作文题

言为心声,想要写出生动活泼的文章,先要有生动活泼的思想。」书里的一个判断,四十年后读来仍然锐利,「如何破除千人一面的学生八股,消除学生作文中的空话、套话,是最需要重视的问题。

我们把问题交给了五个 AI 模型:什么是属于今天的高考作文题?

Claude、ChatGPT、Gemini、豆包和 Kimi 得到了同样的指令,并且自己检索到了差不多的素材:2011 到 2025 年全部 15 年真题原题、官方命题组的评析文献,以及近一年的社会热点关键词。

基于这些素材,它们被要求进行研究和理解,第一步,让它们研究命题原则,搞清楚「高考作文题应该长什么样」;第二步,让它们自己出一道 2026 年的题。

高考语文即将开考,在真题揭晓之前,先来看看 AI 交出了什么卷子。

AI 眼中的高考作文

五个模型拿到同样的任务,做法完全不同。

Claude 是唯一一个把这件事当工程来做的。它没有一头扎进检索,而是先去找总纲性的框架文件,锁定了 2019 年发布的《中国高考评价体系》和它的「一核四层四翼」,然后顺着这条线去找关键人物。张开(教育部考试中心的命题专家,2015 年提出了「任务驱动型作文」);温儒敏,(统编教材总主编,长期批评作文评分「趋中率」过高,主张回归理性和思辨), Claude 把这些人和核心主张串成了一条十年演变的脉络,从 2015 年任务驱动登场,到 2020 年评价体系落地,再到 2024 年「新质生产力」和「拔尖创新人才」。最终交出了一份四层结构的研究框架,总纲、官方评析渠道、关键人物、十年脉络。

高考前一天,五个 AI 出了同一道作文题

Gemini 的原则分析不差,四大原则拆得清楚,也找到了张开和温儒敏。但真题检索弱了明显一截,它甚至是五个模型里唯一一个不完整抓取真题原题的,直接丢失了原始表述(可能是因为这时候它还不知道接下来它的任务是什么),像一个读了很多二手文献却没翻过的研究者。

高考前一天,五个 AI 出了同一道作文题

豆包给了全场最长的输出。从 2011 年逐年罗列到 2025 年,每一年都标注了命题背景、命题思路、官方解读、关键转向,后面还附了维度总结和表格。信息量巨大,通篇是「年鉴」的写法,给你所有信息

高考前一天,五个 AI 出了同一道作文题

ChatGPT 是全场最慢的,第一轮任务思考了整整 34 分钟才动手。最终产出了一个 Excel 索引表,六张工作表,按证据等级分了 A、B、C。作为学术检索工具非常专业,但你没法从一个 Excel 里摘出一段观点来用。Kimi 也走了类似路线,把命题原则收进了一张整理好的专家观点表格。两个模型都跳过了「分析」这一步,给你一个数据库,让你自己去找答案。

高考前一天,五个 AI 出了同一道作文题

Kimi 生成的表格报告

不过,方法论差异再大,五个模型都读到了同一套密码:

立德树人、一核四层四翼、反套作、情境化、思辨性,们在「命题组想要什么」这件事上达成了高度共识。

在这种时候,应该是各自发挥的时候了,但是分歧没有出现。

五道题,一个答案

我们让五个模型各出一道 2026 年高考作文题,它们得到的也都是相同的 prompt:根据你的研究和分析理解,出一道 2026 年高考语文的作文题。

Gemini 写的是「零摩擦生活」。算法精准推送、导航避开拥堵、智慧生活圈免去线下交往的繁琐,人们享受着「零摩擦」的便利。然而哲学家指出,人类的成长往往发生在遭遇阻力与绕道远行之时。

Kimi 做了一个古今对照。1936 年长征结束,一位老红军说「终点在前方,走过去了才知道」。2026 年,一位年轻人在社交媒体上写:「我走的每一步都是『正确』的,但我越来越不知道自己想去哪里。」

豆包的题叫「快捷键时代」。AI 一键生成文案、视频倍速播放、学习追求速成。然而敦煌的工匠用一生打磨一幅壁画,故宫的修复师耗时几十年复原一件文物。

ChatGPT 写的是「尺度」。分数、排名、流量、效率、模型评分,这些「尺子」帮人们看见差距。可是热爱、坚守、独立的判断、对他人的体谅,不容易被量出来。青年人需要借助外在的尺度,也要逐渐形成自己的尺度。

Claude 最简洁。导航替我们规划路线,算法替我们筛选信息,AI 替我们写出答案,我们似乎比以往更容易「抵达」。然而也有人说,路走得越省力,留在心里的风景越少。

摩擦力、方向感、沉淀、尺度、风景,五个模型所使用的意象各不同,但如果把修辞剥掉,它们在说同一件事:技术让生活变得便捷高效,但人类某种深层的价值正在这个过程中被消解,

没有任何一个模型跳出了「科技便利 vs 人文深度」这个框架。

值得一提的是,Claude 因为我的 prompt 复制粘贴少了年份限制,实际它只读了 2016 到 2025 年的真题,比其他模型少了五年数据,但这并没有让它的题目方向产生任何偏移,少五年样本,并没有影响出题方向。

高考前一天,五个 AI 出了同一道作文题

这不完全是意外,近三年真题一直在围绕「AI 时代的人」做文章,2024 年新课标 I 卷直接问「随着互联网和人工智能的普及,问题会越来越多还是越来越少」。

语言模型的判断建立在它见过的文本分布之上,而近年的文本天然比早年的权重更高。

2024 年那道 AI 题在教育媒体上被反复讨论、解读、引用,产生了远超其他年份的文本量,对模型而言这就是一个被放大了的信号,所有模型都把它当作了 2026 年最可能延续的方向。

不过,在高度收敛之下,微妙的差异仍然值得看。

Kimi 是最聪明的。它想到了 2026 年是长征胜利 90 周年,把纪念日嵌进了题面,用「草鞋」和「导航」做古今对照。这说明它不只在做主题推演,还在做日历计算,理解了高考作文「逢十大庆」的隐性传统,题目本身也比较生动,有画面感。

高考前一天,五个 AI 出了同一道作文题

ChatGPT 的「尺度」最让我意外,它虽然也碰了算法和模型评分,但核心其实是关于评价体系,不完全困在科技 vs 人文的对立里。而且「

尺度」这个词本身有不错的文字质感,比「摩擦力」和「快捷键」相比,要更有画面感。

考虑到它 34 分钟的思考时间,也许慢有慢的道理。

高考前一天,五个 AI 出了同一道作文题

豆包则踩中了最大的雷。敦煌工匠、故宫修复师,这些素材本身就是考生会背的「万能例子」,而命题组过去十年最核心的技术追求之一就是「反套路」。

一道让考生可以直接搬出万能素材的题,恰好是命题组最不想出的那种题。

高考前一天,五个 AI 出了同一道作文题

Claude 在前一步的调研里断层领先,四层框架、检索路径、判断优先级,研究做得最深。但到了出题这一步,它的题反而是最平的,像一道标准的模拟卷练习,正确,但没什么记忆点。研究做得最深的模型,出了最安全的题。

AI 出不了的那道题

五道题都像模像样,材料简洁、思辨内置、贴近学生生活,完全符合近年的命题风格。如果混在一堆教辅模拟卷里,你很难分辨出哪道是 AI 出的。

它们太像了,太像彼此,也太像你能预期到的样子。

AI 做命题研究的时候可以表现得非常好。Claude 能梳理十年的原则演变脉络,能判断哪些文献是一手的、哪些是二手转述。这些能力是真实的,某些维度上甚至超过了普通的教研工作者。

高考前一天,五个 AI 出了同一道作文题

图片来自:《全国高考作文评分系统与各类标准卷选》目录

但当它从「理解规则」走向「运用规则出题」的时候,问题出现了。

高考作文命题有一项核心技术,叫「反预期」。张开当年提出任务驱动型作文,就是因为传统材料作文让考生可以提前背好万能模板,命题组需要一种新的出题方式,来让预先准备好的范文瞬间失效。温儒敏批评「套作」,历年命题评析里反复出现「反押题」「反宿构」这些词,背后都是同一个意思:

好的题目应该让所有人猜不到。

高考前一天,五个 AI 出了同一道作文题

图片来自:《中华读书报》

而 AI 给你的,永远是最可能的那个方向,这是统计模型的结构性特征。你给它足够多的样本,它能精准地提取出趋势的最大公约数。

五个模型不约而同地收敛到「科技便利 vs 人文深度」,是因为这个方向在近年的真题和评析中信号最强,是所有可出方向里概率最高的那一个。

换句话说,AI 在做的事是一种极其精密的押题。

1985 年的敌人是学生背范文,2015 年的敌人是教辅产业链批量生产模板,2026 年的敌人变成了 AI。每一代的「八股」都比上一代更精密、更高效、更难破除。

但命题组的核心任务从来没变过,「反押题」是他们需要坚守的核心原则。如果全中国的 AI、教辅、名师预测都指向同一个方向,命题组要做的就是绕开它。AI 擅长在规则之内找到最优解,而命题需要的是在规则之内制造意外。

AI 能给你「情理之中,情理之中」,但好的高考作文题要的是「意料之外,情理之中」。

1985 年时研究组提到,写作涉及两种思维,一种叫「求同思维」,按同一方向思考;一种叫「求异思维」,从不同方面探索。不同思维都可以体现创造力,而衡量创造力有两个原则:新颖程度,以及合理性,

并不是一切新奇都是富于创造性的——这几乎就是「意料之外,情理之中」的学术版表述,写在 AI 出现之前四十年。

AI 是人类造出的最强大的求同机器,它能把所有已知信号汇聚成一个概率最高的解。而我们一次又一次的看到,这种做法最终会导向的是

无趣、无效、无力。

明天语文开考,等真题揭晓时我们再来看看,四十年后的命题组,怎么破这一代的八股。同时,也预祝所有即将走上考场的学子们,轻松应战,全面发挥。高考并不真正决定全部的命运走向,但这将会是各位人生道路中,一个难忘夏天的终点。

文章来自于微信公众号 “APPSO”,作者 “APPSO”

联系方式

赞赏支持

累计赞赏 0 积分 0 人支持
登录后赞赏

💬 发表评论