你好赵伟

这个屌丝很懒，什么也没留下！

热门标签

2024高考数学压轴题解析——数学 VS AI最后的倔强

作者：你好赵伟 | 2024-07-05 03:29:20

踩

24年数学压轴题编程题用什么算法做

早点关注我，精彩不错过！

20240607，今年高考数学正式落下帷幕。遥想过去2年，都是1天内就迅速过了一把瘾，短暂进入那遥远岁月的感觉，又片叶不沾身地回到当下的日子，并聊以文章表示纪念：

接着首发！2023全国1卷数学压轴题解析

首发！2022高考数学压轴题解析！

今年光景不同了，加端午节的3天所谓小长假，我都在各种做饭带娃的特种兵的紧张中度过，一副完全没有时间，更抽不出精力进入沉浸式的解题状态。

不过吧，隐藏习惯必有深深回响。那种对刻死在心头写死熟悉感的渴求还是占据了我的心神，今天终于仔细读了一把题。不出意外，不复当年状态，花费了远超考场所限的时间，才逐步获得解答。而再复盘题目背后的考察思路，不禁让我惊叹：这高考题是越来越有水平了！这题啊，我觉得从思维、数感到逻辑，都体现着数学对AI最后的倔强，那就是AI你破解我还嫩点儿！

据不完全统计，国内外目前的AI工具，在这题上，从第一问开始就基本胡说八道了，更别提后续结论。只能说AI应该完全没看懂，读再多的数据也没有真的在这里涌现。

总体而言，它在不值一提的基础知识背后，考察了只有数学解题艺术所独有的门道，甚至其基础背景里也有我额外发现的秘密。当然，题目也不是没有缺点，且听我一一道来。

先看原题和我的解答。

原题

解答

以上解答为提示解题思路，均用分析法为主来写的。

解析

过去2年，压轴题都是函数方程背景的。虽偶尔有些如数形结合的创新之处，但除了基本的求导、联立等自然工具和思路外，很难有新意远超平日所见又在课纲之内的设计。然而今天这题，看似以数列为背景，又完全不是传统的递归关系和通项公式的配方转化和老掉牙的数学归纳法的套路，这就很是创新和灵活了。表面上看都不知道深入考察了哪个数学知识点和能力，假设再来一次，似乎都不知道要怎么去学习，才能提高做出来的可能。

这题啥玩意啊，我刷了那么多历年考题，记了那么多二级结论，感情都用不上啊！

我积累了那么多解题技巧，你这啥也没考，出这偏题怪题，枉费我十年苦读啊！

真是这样吗，这到底是一道深刻的好题，还是考察知识不甚深入和全面的怪题呢？

我说我的理解，结论还请您自行评判。

总之，做完以后，我有一种感觉，就是那种深深的可能不怎么在现实中有用，但数学人引以为傲的数学思维力，在这题里体现得很深。即，在问题和答案之间的那条求解路径，暂时还很难有通用和模块化的搜索路径，要靠很多说不清道不明的感觉去估算和猜测，再用形式逻辑确认下来。关于解数学题就是路径搜索问题，我在《一道北大强基题背后的故事（七）——特征根公式的来龙去脉》一文中已详细阐释过，Google家的AlphaGeometry的解题建模也是类似的思路。下面我就用这套思路，谈一下我对此题各问的理解。

题设给了一个长为4m+2的等差数列，接着删掉(i, j)的2个元素，再4个一组组成m组等差数列。虽然是等差数列的背景，可从数列里删元素，又拿元素去重新排列组合的操作可是看得懂却极度陌生的操作。很公平啊，谁都没刷过这么玩的秘题，那就凭真本事了。

这里必须敏感地意识到3点。

a. 首先，对于特定的m和(i, j)公差不为0的等差数列之间是否同为所谓(i, j)可分数列是等价关系。我的感觉是这样的，因为从等差数列上取下来的数，其新公差必为nd，显然变换原数列an的a1和d，都不该变取下来的数是否构成等差数列的事实，这是个对称不变操作。因此可以直接假定an=n来等效对称地求解，这就算把这一层对称性拆解掉，使得一定程度的枚举变得可行和最简。

b. 另外，所谓的取数构成等差数列，本质上是一个排列，而且它必然是原数列对应序列的子序列，即有保序性。否则，大小作为全序关系，无法保证公差同号，自然就不可能是等差数列了。

c. 最后，如果忽略掉去掉的2个元素的操作，假设为1,2,......,4m，要想从这个序列里取出等差子序列，等价于取某个起点索引n和公差d。所以，所谓数值的等差数列，粗略看其实是索引上的等差索引。

这3点都在把这个数学空间的解进行降维式的化简，a归约了所有等差数列为1个，b避免了各种排列的讨论，c则为后续找到构造解提供了本质的视角。这些命题本身的证明其实还挺繁琐、也不直观，但方便按图索骥，是纯形式逻辑推演。但是能想到这些命题，就是那看不见的数学脑在一边想象和估算，一边快速和可能并不那么严谨地证明后使用。后者才是困难的，AI暂时还没那么容易突破的，因为这种结构的识别，命题的发现过程，大脑还很难自己总结出自己是怎么想到的每个细节。这就是可怕的数感吧，那种非计算执行的，理解式的人脑演算，深不见底。下面的解析仍然会看到这一点。

考察基本概念和阅读理解能力。所涉及的概念几乎就只有等差数列的定义和排列了，而且排列部分是以拆分这种非常直观的物理过程为背景的，也用不到其严格定义和公式，大家应该都有过这样的生活经验，公平！

所以你看，看起来考察了基础数学知识，可是考得真是浅到新课的水平，很难不懂这些词汇的含义，无非自然语言序列多了几层修饰关系，要猜测理解清楚即可。难的是，你的大脑到底曾经有没有构建过这些概念的画面和过程，以及在想象题意的时候，又直观又准确地建模和还原它们，这一点，我相信AI还有点距离吧。

当然，就算笨点，这题就算枚举C(6, 2)=15种所有可能，也能解了，但这显然是以超时为代价的。当然你要是只记忆了组合数公式，忘了组合的定义以及如何迭代或仿递归地枚举其解集的话，那又要遇到困难了。你看，还是没有掌握底层概念的问题吧。不过，这里作为一个手写算法结果的题，自然还有来自数学估算的剪枝策略可以用。如解析所言，剩余4个数，其公差只能是1，那必然是4为长度的子串了。因此就123的3个开头，就3个解。

1是m=1的所有{a6}数列可分解的求解，因为{an}已经化归了，枚举可得。这里把m放开，但又怕你想偏或接空间太大没有思路，直接给定了(i, j)=(2,13)，要求证明如此可分。

和1一样，我们都是在从最简单的特例出发尝试归纳，这也是数学解题惯用的思路。根据定义，比如m = 3，我们需要找到数列1,3,4,......,11,12,14的至少一组可行的组合C(12, 4)*C(8, 4)即得证，如果m = 4就再来一个C(16, 4)，以此类推，这是此问题要尝试的解空间的上限边界，知道很大并别去试就行，因为得有能力提前估算计算量对应时间得分的考场性价比，哪怕是诉诸算法题，时间复杂度也到阶乘了，显然不是个直接枚举的问题。

这仍然是个阅读理解和手写算法结果题，基础支持仍然限制在数列和排列组合数上。其中阅读理解的难度还在于自然语言背后所谈的这些命题的各种等价形式，比如组合只需要存在，而m必须是任意的都有解。

这时候，自然数的问题联想到数学归纳法是很合理的，但不一定要硬用，总之可以想想看有没有可能方便地递推构造下去。

答案竟然是显然的。m=4比m=3多的值是15,16,17,18，这四个直接作一个划分和原m=3的解一拼就是了，更大的m也一样。好在这是个存在性问题，故m=3的存在性等价于m为任意值的等价性，有数学归纳法那意思了。不过这个等价性又是先感受和猜出来再迅速严格证明的，又是先想到问题再去严谨说明的典范。严谨证明的话，m=3=>m为任意值已证，倒过来的话显然了。

接着这个任意m的问题又变成了m=3的特例上的枚举了。我们仍然有序地采用回溯或递归的思想，并利用公差范围提早剪枝，迅速得到了答案：(1, 4, 7, 10), (3, 6, 9, 12),(5, 8, 11)。

终于来到了终极大关。又不痛不痒地在数列和排列组合的基础上，加入了概率论中古典概型的考察。但这基本没有区分度，即使没学过或忘了这概念，古典概型的公式应该也是能朴素地假定和写出的。

这里概率的问题本质上是要构造出对任意m成立的和m有关组(i, j)解，和分母C(4m + 2, 2) = 8m ^ 2 + 6m + 1的比值要不小于1/8。于是，大概率，我们得构造出和O(m^2)组解，并且系数至少是1/8，这样至少在主部上一致，剩余一次和常数项就到时候再看够不够以及要不要特殊起点特殊证明了，这是从结论出发可以直观倒推到的路径。

而从构造本身出发呢？这就要用上基本的解题经验了，即大题的前问结果一般是作为后问的方向提示，我们要从中用好。

1给了我们什么提示呢？连续子串构造法！即，0.c中我们既然已经提到找等差子序列的本质是约摸的索引等差数列，那显然只要在原数列上就4个连续的一段，并允许中间出现i和j，要么连续出现作为2个的一段，要么出现2次每次长度为1即为所求。于是这种公差为1的构造方法，其不同的(i,j)组合数为C(m + 1, 2)+(m + 1)，这符合O(m ^ 2)数量的假设，但量还差一半。

那2给了什么提示呢？也别忘了，1中胡乱想到的一堆解，还只是d=1的连续子串部分哦，那2中d=3，刚好对应m=3，看起来，有没有可能存在很多d=m的解呢？但仅一组d=m还不够，得d<=m的都有解，而且其仅囊括其中长为4d的一段，其余的，又可以通过前后凑长度为4的子序列获得，这样又获得了和m相关的两个自由度，一相乘就很有戏了。

这里的构造过程，就很看灵感了。硬要说灵感的数学知识来源，这竟然来自序列的周期性，以及数学魔术经典的如Si Stebbins Stack构造中所用的周期构造思想。对于序列1,3,4,......,4n -1,4n,4n +2，2 <= n = d <=m，我们尝试设想一下其真实产生过程。

假设有一条1,2,.....,4n的序列，显然，取(a, a +n, a +2n,a+3n)，ain1:n，即为所求。每个组成等差数列的索引序列内的相等属性为I%n，即同余。而同余处拥有共同性质的属性，本质就是周期性，即该数列周期为n，等价关系为属性I%n相等构成的等价类常量，且索引同值。

你想到什么了？当n=13的时候，这不就是一副按照4套A-K出厂顺序排列的扑克牌吗？和这类似的序还有用来表演4Ace数牌出现的花色打乱版的序，以及经典的花色也呈现周期性的Si Stebbins Stack。这里4这个数不得不让我怀疑此题的真实背景真的来自于扑克牌相关的数学魔术。

再往深了说，这刚好就是个关于+1操作的Cn群，有Cn=Z/nZ，Cn中的每个元素等价于对于nZ自己和陪集的属于关系。而+n操作等价于+0，元素不变，刚好是同余，也刚好能走一圈成为等差索引序列。这里的4个周期，实际上是一个代表周期被展开为了4个真实索引元素值，有几个周期就展开为即可，它们的关系刚好用+n生成，不会逃出群的同一个元素，但展开就刚好等差。显然，an,an+1,......,(a+1)n，也是等差数列，其相等属性是[(I-1)/ n]，这正好对应于1问中的形式。

那接下来的变化就很神奇了，这条完美的4周期序列和目标序列之间，如果能构造出一个不改变目标性质的转化构造过程，那目标序列不也就一同可分了吗？那这两个序列之间的关系是什么呢？

依题意，是拿走2和4n+1，剩余4n个数，但实际上，完全可以理解为1:4n把2拿掉放到4n后面，摇身一变成为4n+2呀！什么？拿走两个数，被改成了移动一个数还换个值，那结论能一样吗？

我们照着原来的解看过去，并用值代替索引来找到对应新元素。此时，只有(2, 2 + n, 2 + 2n, 2 + 3n)，它的2没了，变成2+4n，这不刚刚好在后面又等差的补了一个元素吗，不依旧满足等差性质！而其他的分组数值，完全没有任何变化！

这看起来就像，好好的长周期序列，破坏了第1个周期第2个元素的等价关系空出位置以不破坏其他，在结尾处同样空出首位拼接回来。这样我们知道，如果是3被拿走了，那得去掉4n+1,4n+2两个元素添加4n+ 3，看起来就是个(3, 4n+1,4n+2)的3阶可分数列的扩展了。

此问我第一次做的时候，取的初始解为(2, 13)，没想到还有更小的(2, 9)，这也是在考察我观察是否仔细全面，是否理解到本质了。

由此，又可以构造出C(m - 1, 2)+(m - 1)个解，加上之前的子串解，数量就足够了。

评析

题目讲完了，好不过瘾。本题与其说是数学题，倒不如说是一个不超纲的数学思维游戏。难在构造中要不断凭借所谓数感、直觉，去寻找结论的方向，再用严谨的形式语言说明出来。其中，对称、等价、命题逻辑等核心数学概念渗透其中；而数列，排列组合，概率只起到描述作用，并非重点和门槛；其中也不乏枚举、剪枝等算法思维。而最后这个排列上关于的周期性本质的理解，转为构造周期长度T个长度为周期数n的索引等差数列的想法，实在是深不见底。若不是之前如此在脑海中构建过这等结构，那又得是怎样的运气和实力在考场中迅速意识到这一点。其在排列层面把去2元素理解为一次等效移位，又是何等天才的联想。

然而最神奇的是，这一切真的有扑克牌的背景，4种花色就是明证。而且，在周期性相关的数学魔术中，以Si Stebbins Stack为代表的周期性序列本身，就是这个结构的实物情景呈现了。而连续取值的子串则为其KMP结构，它和周期序列竟然本就是用n阶完美洗牌相互转化的，而本题的构造就是以这2个结构为核心展开的。

不过吧，毫不夸张地说，我是没有信心重来n次高考，我哪怕有1次能蒙对这个级别题的全部的。因为这全新而陌生的背景，之前模拟题从未见过的口味，就像在探索一次全新的旅程，和之前任何一次都不一样，不免要慌了神，丧失信心和继续走下去的：我是不是已经走远，在做梦吧？想起当年理综那个电子运动的物理大题，居然是用的一个数学几何结论解决，和之前训练千百遍的一般套路完全不搭，又怎会有迅速跳出路径依赖的信心和决心呢？除非是真的大心脏，艺高人胆大，处在那样极致的人脑状态下，所迸发出的能量吧。

其实，我觉得本题也不是毫无缺点。即，作为一个有隐含背景的数学题，其结论的美感或实际意义是几乎缺失的。即它的结论虽然简洁，但无论是证明过程，思路获取，还是呈现结果的美感都给人一种生生拼凑的感觉，并不是那种很通用的定理式的结论本身和思路都值得借鉴和记忆，而还真就适合见光死，考察一次就完了，你背下来也没用的，更别以后拿来刷题。

比如，我做完了还有疑问：这题到底有多少解？除了我们构造的这些还有没有别的解？似乎数学层面就不太好轻松解决了，或许能够证明能取到的解只能是一串等公差的移位结构加一大堆等公差或KMP拼成的结构，也许要借助算法枚举一下特殊情况再观察观察，这里不进一步展开了。

最后我想说，也许到了这个级别的思维层级，单靠数据量和网络深度的进步，也远远没有达到AI能涌现解决的程度。数学依旧还会不断进步，保有它永远比算法执行结果高一个层级的认知，领先一个身位。哪怕有一天，它不小心自己解决了自己，那也会自己递归下去，形成新的高级认知结构，覆盖现在人类的认知范围。

明年见！

附：2024高考数学全国1卷试题

我们是谁：

MatheMagician，中文“数学魔术师”，原指用数学设计魔术的魔术师和数学家。既取其用数学来变魔术的本义，也取像魔术一样玩数学的意思。文章内容涵盖互联网，计算机，统计，算法，NLP等前沿的数学及应用领域；也包括魔术思想，流程鉴赏等魔术内容；以及结合二者的数学魔术分享，还有一些思辨性的谈天说地的随笔。希望你能和我一起，既能感性思考又保持理性思维，享受人生乐趣。欢迎扫码关注和在文末或公众号留言与我交流！

扫描二维码

关注更多精彩

CATO原理中的数学与魔术（十二）——CATO与MAT principle

魔术里的交代与暗交代（三）——暗交代是怎么做的？

牛顿运动定律的谜团（四）——牛顿定律的数学模型

魔术《4 Kings 折纸》的三重境界（四）——魔术效果的突破

视错觉与魔术（二）——橡皮筋的奇迹

点击阅读原文，往期精彩不错过！

声明：本文内容由网友自发贡献，不代表【wpsshop博客】立场，版权归原作者所有，本站不承担相应法律责任。如您发现有侵权的内容，请联系我们。转载请注明出处：https://www.wpsshop.cn/w/你好赵伟/article/detail/789068