边关急报:敌军传书使用了一种从未见过的密码,截获密信三封,朝中无人能解。皇帝急召密院的解密官入宫。
解密官有两人——老解密官周慎,少解密官赵捷。周慎年过六旬,解了一辈子密码;赵捷是去年新进的年轻人,以心算奇快闻名。
皇帝说:“三日内解出此密码者,赏黄金百两。”
天才的直觉
赵捷拿到密信,盯着看了半炷香,忽然拍案叫好:“我知道了!”
他提笔在纸上写下答案,快步送到御前。皇帝一看,问道:“你确定?”
赵捷拍着胸脯:“回陛下,臣凭直觉判断,此密码必是如此。”
皇帝让学士们验证,发现三封信只解对了一封,另外两封完全不通。
赵捷灰头土脸地回到密院,百思不得其解——他明明感觉到了规律,怎么只对了一个?
老官的账本
周慎没有急着下结论。他翻开一本厚厚的账本——这是他几十年养成的习惯。
他在第一页写下:
“密信一:观察到字符共 27 种,其中 26 种为常见汉字,1 种为特殊符号。猜测特殊符号可能是分隔符。”
翻一页:
“去掉分隔符后,观察每段长度。第一封信的三段长度分别为 3、5、3。不符合常见密码的等长特征,排除凯撒替换。”
再翻一页:
“尝试统计每个字符出现频率。最常见的字符是’之’,出现 7 次。对照汉语字频表,最常见的字是’的’。假设’之’→‘的’,那么……”
就这样,周慎一页一页地写,一步一步地推。有些步骤走通了,有些走进了死胡同,他就划掉重来,在旁边写上新的推论。
三天后,周慎带着解好的三封信和一本写满的账本上殿。学士们逐一验证——三封全部正确。
皇帝翻看那本账本,大为赞叹:“妙!每一步推理都清清楚楚,一目了然。”
账本的秘密
赵捷私下请教周慎:“周大人,您是怎么做到的?”
周慎翻开账本,指着第一页说:“我不是一下子跳到答案的。你看——我先观察,再假设,再验证,再根据验证结果调整假设。每一步都写下来,这样我有两个好处:第一,如果某一步错了,我可以回头找到错在哪里;第二,一步一步走,每一步都不难,但连起来就能解开看似不可能的谜题。”
赵捷恍然大悟:“所以我之前只对了一封,是因为我试图一步到位——我的直觉有时候对,但更多时候会跳过关键的中间步骤。”
周慎点头:“你的直觉其实比我好。但你缺的不是聪明,是耐心。把脑子里的过程摊开来,一步一步写清楚,正确率自然就上去了。”
故事讲完了。
周慎的那本账本,就是 AI 领域中 Chain-of-Thought(思维链) 的完美隐喻。
大型语言模型在面对复杂问题时,如果被要求直接给出答案(像赵捷那样),往往会出错——尤其是涉及数学推理、逻辑推导、多步判断的任务。模型可能会"凭直觉"跳到错误的答案。
Chain-of-Thought 的核心思想极其简单:别直接给答案,先把推理过程一步步写出来。
就像周慎的账本一样,CoT 让模型将一个复杂问题分解为一系列中间推理步骤:
- 观察:从输入中提取关键信息。
- 假设:基于观察提出可能的推理方向。
- 验证:对假设进行推演,看是否自洽。
- 调整:如果验证失败,回溯并修正推理路径。
- 得出结论:基于完整的推理链条给出最终答案。
这个方法在 2022 年由 Google 的 Wei 等人在论文 Chain-of-Thought Prompting Elicits Reasoning in Large Language Models 中正式提出。他们发现,只需在提示词中加入几个"展示推理过程"的示例,大模型在数学、常识推理等任务上的表现就会大幅提升。
后来的研究进一步发现,即使不提供示例,只简单加上一句"Let’s think step by step"(让我们一步步思考),模型的表现也会显著改善——这被称为 Zero-shot CoT。
CoT 之所以有效,是因为语言模型的生成机制是"逐 token 输出"的。每生成一步推理,就相当于为自己提供了更多的上下文,让后续的推理建立在更扎实的基础之上。正如周慎所说——“一步一步走,每一步都不难,但连起来就能解开看似不可能的谜题。”
下次当你看到 ChatGPT 在回答数学题时,先列出已知条件,再一步步推导的时候,你就知道——它也翻开了一本账本。