解密官的账本

边关急报：敌军传书使用了一种从未见过的密码，截获密信三封，朝中无人能解。皇帝急召密院的解密官入宫。

解密官有两人——老解密官周慎，少解密官赵捷。周慎年过六旬，解了一辈子密码；赵捷是去年新进的年轻人，以心算奇快闻名。

皇帝说：“三日内解出此密码者，赏黄金百两。”

天才的直觉

赵捷拿到密信，盯着看了半炷香，忽然拍案叫好：“我知道了！”

他提笔在纸上写下答案，快步送到御前。皇帝一看，问道：“你确定？”

赵捷拍着胸脯：“回陛下，臣凭直觉判断，此密码必是如此。”

皇帝让学士们验证，发现三封信只解对了一封，另外两封完全不通。

赵捷灰头土脸地回到密院，百思不得其解——他明明感觉到了规律，怎么只对了一个？

老官的账本

周慎没有急着下结论。他翻开一本厚厚的账本——这是他几十年养成的习惯。

他在第一页写下：

“密信一：观察到字符共 27 种，其中 26 种为常见汉字，1 种为特殊符号。猜测特殊符号可能是分隔符。”

翻一页：

“去掉分隔符后，观察每段长度。第一封信的三段长度分别为 3、5、3。不符合常见密码的等长特征，排除凯撒替换。”

再翻一页：

“尝试统计每个字符出现频率。最常见的字符是’之’，出现 7 次。对照汉语字频表，最常见的字是’的’。假设’之’→‘的’，那么……”

就这样，周慎一页一页地写，一步一步地推。有些步骤走通了，有些走进了死胡同，他就划掉重来，在旁边写上新的推论。

三天后，周慎带着解好的三封信和一本写满的账本上殿。学士们逐一验证——三封全部正确。

皇帝翻看那本账本，大为赞叹：“妙！每一步推理都清清楚楚，一目了然。”

账本的秘密

赵捷私下请教周慎：“周大人，您是怎么做到的？”

周慎翻开账本，指着第一页说：“我不是一下子跳到答案的。你看——我先观察，再假设，再验证，再根据验证结果调整假设。每一步都写下来，这样我有两个好处：第一，如果某一步错了，我可以回头找到错在哪里；第二，一步一步走，每一步都不难，但连起来就能解开看似不可能的谜题。”

赵捷恍然大悟：“所以我之前只对了一封，是因为我试图一步到位——我的直觉有时候对，但更多时候会跳过关键的中间步骤。”

周慎点头：“你的直觉其实比我好。但你缺的不是聪明，是耐心。把脑子里的过程摊开来，一步一步写清楚，正确率自然就上去了。”

故事讲完了。

周慎的那本账本，就是 AI 领域中 Chain-of-Thought（思维链） 的完美隐喻。

大型语言模型在面对复杂问题时，如果被要求直接给出答案（像赵捷那样），往往会出错——尤其是涉及数学推理、逻辑推导、多步判断的任务。模型可能会"凭直觉"跳到错误的答案。

Chain-of-Thought 的核心思想极其简单：别直接给答案，先把推理过程一步步写出来。

就像周慎的账本一样，CoT 让模型将一个复杂问题分解为一系列中间推理步骤：

观察：从输入中提取关键信息。
假设：基于观察提出可能的推理方向。
验证：对假设进行推演，看是否自洽。
调整：如果验证失败，回溯并修正推理路径。
得出结论：基于完整的推理链条给出最终答案。

这个方法在 2022 年由 Google 的 Wei 等人在论文 Chain-of-Thought Prompting Elicits Reasoning in Large Language Models 中正式提出。他们发现，只需在提示词中加入几个"展示推理过程"的示例，大模型在数学、常识推理等任务上的表现就会大幅提升。

后来的研究进一步发现，即使不提供示例，只简单加上一句"Let’s think step by step"（让我们一步步思考），模型的表现也会显著改善——这被称为 Zero-shot CoT。

CoT 之所以有效，是因为语言模型的生成机制是"逐 token 输出"的。每生成一步推理，就相当于为自己提供了更多的上下文，让后续的推理建立在更扎实的基础之上。正如周慎所说——“一步一步走，每一步都不难，但连起来就能解开看似不可能的谜题。”

下次当你看到 ChatGPT 在回答数学题时，先列出已知条件，再一步步推导的时候，你就知道——它也翻开了一本账本。