Chain of Thought（CoT）笔记

一句话看懂：CoT 的关键不是“让模型更聪明”，而是让它把推理过程写出来——用可见的中间步骤降低复杂任务的跳步与出错率。

一、什么是 CoT？（核心概念）

在过去，我们向大模型提问通常是“直球对决”（Standard Prompting）：输入问题 → 直接输出答案。这种方式在处理简单问答时很高效，但在面对复杂的数学、逻辑推理或多步骤的代码架构设计时，模型很容易出现“幻觉”或逻辑断层。

Chain of Thought (思维链) 的核心思想很简单：不要让模型直接给答案，而是强制它把得出答案的“中间推理过程”一步步写出来。 这就好比在数学考试中，老师不仅要求你写出最终结果，还要求你写出完整的解题步骤。

二、浅层理解：CoT 的经典 Example

为了直观理解，我们来看一个经典的对比案例（基于 Wei et al., 2022 的开创性论文）。

❌ 标准提示词 (Standard Prompting)

User: 罗杰有 5 个网球。他又买了两罐网球，每罐有 3 个网球。他现在一共有多少个网球？

AI: 罗杰现在有 11 个网球。

User: 食堂有 23 个苹果。他们用 20 个苹果做午餐，然后又买进 6 个苹果。现在食堂有多少个苹果？

AI: （模型可能会直接输出错误答案，因为它试图在内部一次性跨越所有计算逻辑） 27个。

✅ 思维链提示词 (Chain of Thought Prompting)

User: 罗杰有 5 个网球。他又买了两罐网球，每罐有 3 个网球。他现在一共有多少个网球？

AI: 罗杰原来有 5 个球。2 罐网球，每罐 3 个，一共是 6 个网球。5 + 6 = 11。答案是 11。

User: 食堂有 23 个苹果。他们用 20 个苹果做午餐，然后又买进 6 个苹果。现在食堂有多少个苹果？

AI: 食堂原来有 23 个苹果。用去 20 个后，还剩 23 - 20 = 3 个苹果。他们又买了 6 个，所以现在有 3 + 6 = 9 个苹果。答案是 9。

💡 核心结论： 通过在示例中示范“思考过程”，模型在回答新问题时，也会模仿这种分步拆解的逻辑，从而大幅提升复杂任务的准确率。

三、进阶演化：CoT 的两大主流门派

在实际应用中，构建 CoT 提示词通常分为两种方式：

1) Zero-Shot CoT（零样本思维链）

当你不想费时费力去写一大堆示例时，可以通过一句“魔法咒语”强制激活模型的内在推理能力。

做法： 在 Prompt 的最后加上一句 “Let’s think step by step.”（让我们一步一步地思考）。
Example： > “请帮我设计一个支持高并发的抽奖系统数据库表结构。Let’s think step by step.”
效果： 模型会自动开始拆解：第一步分析业务场景，第二步分析核心字段，第三步考虑索引和防超卖逻辑，最后输出 SQL。

2) Few-Shot CoT（少样本思维链，结合 Few-Shot Prompting（少样本提示）笔记）

在处理特定领域的复杂任务（如特定的代码规范、私有 API 调用）时，Zero-Shot 可能不够精准，这时候需要人为提供 1-3 个带有完整推理过程的示例。

做法： 提供 <Question> -> <Reasoning> -> <Answer> 的模板。
适用场景： 需要严格控制输出格式、或者逻辑非常绕的业务场景。

四、高阶玩法：突破线性思维

随着 AI 编排和复杂任务交付的需求增加，基础的单线 CoT 演化出了更高级的形态：

1) Self-Consistency CoT（自我一致性）

大模型是有随机性的（温度参数）。对于同一个复杂问题，生成一次 CoT 可能中途算错。

原理： 让模型并行生成多条不同的“思维链”（比如 5 条），然后对最终答案进行多数投票 (Majority Vote)。
应用： 极高容错率的代码逻辑推演或核心算法生成。

2) Tree of Thoughts（ToT，思维树）

人类在思考复杂问题时，如果发现某条路走不通，会退回上一步换条路走。ToT 就是赋予大模型这种“搜索与回溯”的能力。

原理： 将中间思考步骤视为树的节点。模型不仅往前生成，还会对当前的推理路径进行“自我评估”。如果不通，则放弃该分支。

五、落地实践：在日常 AI 辅助开发中的运用

理解了理论，如何在实际工作（如使用 Claude、Gemini、Cursor 等工具快速交付 MVP）中用好 CoT？

最佳实践：利用 XML 标签结构化思考过程（思路延伸见结构化输出（Structured Output）笔记）

当你需要模型帮你写一段复杂的组件代码或排查 Bug 时，不要只给一个指令，而是用 Prompt 约束它的思考空间：

Plaintext

你是一个资深的前端开发工程师。我现在需要用 Flutter 实现一个复杂的抽屉动画组件。

在输出代码之前，请遵循以下步骤：
1. 在 <thinking> 标签内，分析该动画需要的核心动画控制器 (AnimationController) 数量，以及性能优化的关键点。
2. 在 <step_by_step_plan> 标签内，列出你的代码实现思路。
3. 最后，在 <code> 标签内输出完整的 Dart 代码。

为什么这很管用？

模型在生成 <thinking> 标签内的文本时，实际上就是在为接下来生成做“预热”和逻辑铺垫。这能极大降低代码报错率，让你离“一键运行 MVP”的目标更近。

Chain of Thought（CoT）笔记

一、 什么是 CoT？（核心概念）

二、 浅层理解：CoT 的经典 Example

三、 进阶演化：CoT 的两大主流门派

四、 高阶玩法：突破线性思维

五、 落地实践：在日常 AI 辅助开发中的运用

相关笔记

一、什么是 CoT？（核心概念）

二、浅层理解：CoT 的经典 Example

三、进阶演化：CoT 的两大主流门派

四、高阶玩法：突破线性思维

五、落地实践：在日常 AI 辅助开发中的运用