提示词从入门到精通

A Complete Guide from Beginner to Master

创建者: 花叔 为谁创建: 每天用 AI 的人——产品、运营、程序员、设计师，以及想搞懂"为啥 AI 不听话"的所有人基于: OpenAI / Anthropic / Google 三大官方指南 + LangGPT 社区 32 篇实战内容 最后更新: 2026-06-05 适用场景: 写 Prompt 卡壳时翻一翻，想系统学提示词时从头读

前言

我用 AI 大概 3 年了。从最开始的 ChatGPT，到现在的 Claude Code、Cursor、各种 Agent。前两年我一直在做"调参侠"——同样的问题换个说法问三遍，看哪个回答能用。这个状态大概持续到 2024 年初。

转折点有两次。第一次是读到李继刚的"提示词 = 表达"那句话。第二次是我自己用一个伪代码控制 LLM 的技巧，把字幕整理的活从 40 分钟压到 3 分钟。那一刻我才意识到：我之前没学会跟 AI 说话，不是因为 AI 不够聪明，是我自己没说清楚。

这本书就是从那次觉悟开始写的。我没有堆理论，没有抄论文。就是把过去 3 年踩过的坑、用过的方法、读过的内容，全部摊开给你看。

读完你能做到三件事：

看一段 Prompt，能立刻判断它哪里有问题
拿到一个新场景，能在 10 分钟内写出第一版可用的提示词
知道什么时候该优化 Prompt，什么时候该上 RAG，什么时候该微调

不保证你成为提示词大师。但保证你少走我走过的弯路。

花叔的经验：这本书适合两类人。一类是刚接触 AI 不知道从何下手。读 Part 1 起步就够了。一类是用了 AI 一段时间但总觉得"差点意思"。重点看 Part 2 和 Part 3。

Part 1: 起步

从零到一。读者读完能写出第一条可用的提示词。

§01 提示词改变了什么

01.1 我从"调参侠"到"写指令的人"

2022 年底 ChatGPT 出来的时候，我跟大多数人一样兴奋。试着写代码、写信、做总结。结果经常被 AI 气得想砸键盘。

最常见的场景是：我问"帮我写一个 Python 函数，把列表里大于 10 的数过滤出来"。 AI 给我回了一段代码，但用了 lambda 表达式，还有几个我查文档才认出来的库。我想要的是 for item in lst: if item > 10: ... 这种最直白的版本。我问了三遍，每遍的回答都不一样。我以为是 AI 的问题。

直到 2024 年，我才搞明白一件事： 不是 AI 不听话，是我没说清楚我要什么。 我应该说"用最朴素的写法，不要 lambda，不要额外依赖，初学者能看懂"。一句话的事。我之前没意识到。

这就是这本书要解决的核心问题。

01.2 AI 是你的"博学但健忘的实习生"

谷歌那本 68 页提示词白皮书里有个比喻，我觉得最到位： AI 就像一个博学但刚入职、还有点健忘的超级实习生。

展开说：

博学：训练数据覆盖了人类大部分公开知识。问他历史、科学、编程，几乎都能答。
刚入职：不知道你公司的业务、你的偏好、你的边界。
健忘：对话超过一定长度，会忘掉前面说过的话。

理解这个比喻，写 Prompt 就有底了。你跟新同事布置任务，会怎么做？会告诉他背景、目标、要求、输出格式。提示词工程，本质上就是把这种"跟人说话"的方式结构化，喂给 AI。

01.3 提示词工程 vs 传统编程

很多人会把写 Prompt 当成"用自然语言编程"。我觉得这个比喻对一半。

维度	传统编程	提示词工程
控制方式	代码指令（确定性）	自然语言（概率性）
调试方式	print / 断点 / 单测	迭代优化、A/B 测试
学习曲线	陡峭但有边界	平缓但深度无限
错误模式	编译报错、运行时崩溃	答非所问、胡说八道

重点看：学习曲线那一行。传统编程学到头就是学完所有库和框架。但提示词工程没有"学完"这件事——模型在变、任务在变、最佳实践一直在变。

写 Prompt 不是把传统编程"翻译"成自然语言。是另一种沟通。你越会说人话，AI 越会说人话。

01.4 一个时间线：3 年提示词工程的演化

2019-2022 萌芽期：Few-shot、CoT 等基础技巧出现在论文里
2022 年 4 月：云中江树在上下班路上想到结构化提示词方法
2022 年 5 月：LangGPT 开源
2022 年底：ChatGPT 横空出世，Prompt 大爆发
2023 年：LangGPT / CO-STAR / CRISPE 等结构化框架成熟
2024 年：The Prompt Report 综述涵盖 58 种提示技术
2024 年至今：Agent、多模态、系统化提示词工程

你看到的是一个清晰的趋势： 从零散技巧 → 框架化方法论 → 系统化工程。 写 Prompt 从"碰运气"变成了"可学习、可复用、可衡量"的技能。

核心建议：如果你刚开始学，不要追新框架。先把"跟 AI 说清楚话"这件事练扎实。所有的框架、模板、工具，都是为了这个目标服务。

01.5 适合谁 / 不适合谁

这本书适合：

每天用 AI 但经常觉得"差点意思"的人
想把 AI 嵌入工作流，但不知道如何稳定输出的人
对写 Prompt 感兴趣，但被网上零散资料劝退的人

这本书不适合：

想找"魔法词"让 AI 立刻变聪明的人（不存在这种东西）
想做 AGI / 训练基础模型的人（这是另一本书的事）
期待看完就能年薪百万的人（能涨薪，但没那么夸张）

到这里你应该清楚：提示词工程不是玄学，是一门可以学的沟通技能。

下一章，我们直接动手——注册账号、第一次跟 AI 说话。

§02 第一次跟 AI 说话：从注册到第一条 Prompt

02.1 你需要什么

一个能上网的电脑或手机
一个邮箱（用来注册账号）
大概 30 分钟

本章用 ChatGPT 做演示。但 Claude、Gemini、文心、通义都一样。道理是相通的。

02.2 注册账号

第一步：打开 chat.openai.com。

第二步：点击 Sign Up，输入邮箱。预期结果：进入手机验证页面。

第三步：输入手机号，接收验证码。预期结果：进入对话页面。

注意：国内手机号可能注册不成功，需要国外号码或者用第三方登录。我自己用的是 Google 账号登录。

第四步：选择模型。默认是 GPT-4o 或者更新的模型。不要选 GPT-3.5。

花叔的经验：3.5 跟 4 的差距，不是"稍微差点"，是"差一个时代"。做演示可以，上生产用 3.5 是给自己挖坑。

02.3 你的第一条 Prompt

页面中间有个输入框。我们写第一条 Prompt。

不要这样写： "写一首诗"

AI 会给你一首很普通的诗。五言七言你自己选。但你想要什么风格的？写什么主题？给谁看？ AI 不知道。

应该这样写： "请写一首七言绝句。主题是'程序员加班到深夜看见日出'。押平水韵。"

预期结果：AI 会给你一首稍微靠谱点的诗。

再加一层：

"我是程序员，30 岁。读到这首诗会有共鸣。不要用'代码如诗'这种烂梗。"

预期结果：AI 这次写得明显更有"人味"。

你看，同样的任务，Prompt 越具体，输出越稳定。这就是写 Prompt 的核心：把你脑子里的上下文，喂给 AI。

02.4 三个新手必踩的坑

坑 1：把 AI 当许愿机

"帮我写一篇爆款公众号文章"——AI 不知道你账号的调性、你的读者画像、你想要的转化路径。它只能给你一个平均水平的答案。

怎么改：把约束条件全部写出来。 "我是写 AI 编程内容的公众号。读者是 30-40 岁的程序员。标题要有冲突感但不要标题党。开头先讲一个具体场景。"

坑 2：否定句太多

"不要用专业术语"、"不要长句子"、"不要用列表"——AI 看到"不要 X"的时候，反而会关注 X（粉色大象效应）。这是行为心理学里一个经典发现。

怎么改：把否定句改成肯定句。不要说"不要用专业术语"，说"用初中生能看懂的语言"。

坑 3：对话越来越长就跑偏

跟 AI 聊了 20 轮之后，你会发现它开始"忘记"最开始说过的话。这是 LLM 的本质限制——上下文窗口有上限。

怎么改：长任务拆成几步，每步用清晰的 Prompt 重新启动。这个我们 §06 详细讲。

02.5 第一次跑通的成就感

到这里你应该已经成功让 AI 给你写了一首不那么烂的诗。或者做了个不那么离谱的总结。或者改了一段不那么别扭的英文。

这个感觉很重要。它证明了一件事：你跟 AI 之间的沟通瓶颈，不在 AI，在你的 Prompt。

下面我们开始系统讲方法。

核心建议：接下来 3 章，把所有方法都过一遍。不需要背下来，只需要知道"原来还能这样"。用的时候回来查。

§03 提示词的本质：它是控制指令，不是咒语

03.1 一个反直觉的发现

很多人把"提示词工程"想得很玄学。觉得是某种"魔法词"——加一句"让我们一步步思考"，AI 就变聪明了。加一句"你是一个专家"，AI 就专业了。

我刚开始也这么干。后来读到一篇文章，说**"深呼吸"这个词只对谷歌的 PaLM 模型有效**。同样的 Prompt 放到 GPT 上，完全没用。

那个瞬间我意识到："魔法词"这个概念是错的。

提示词不是咒语。提示词是对 AI 的控制指令。形式不限于自然语言。伪代码、JSON、XML、Markdown——AI 都能理解。只要你把它当成"给 AI 的指令"来写，而不是"对 AI 的祈祷"。

03.2 三个人对"提示词本质"的不同回答

学界和社区对"提示词是什么"有三种主流回答。我把它列出来，你自己判断哪个更对。

观点 A：提示词是控制指令（包宇/baoyu）

代表人物：包宇，做过多个提示词工程实战项目
核心观点：Prompt 形式不限于自然语言。LLM 训练过大量代码，对伪代码理解能力极强。
典型应用：用 TypeScript 类型定义描述输出格式，比自然语言更精准。

观点 B：提示词是表达（李继刚）

代表人物：李继刚，提示词圈最被推崇的实战派
核心观点："提示词的本质就是表达。"
典型应用：从 5000 字 Markdown 长文，进化到 5-6 个核心词。

观点 C：提示词是 AI 时代的编程语言（云中江树）

代表人物：云中江树，LangGPT 作者
核心观点：Prompt 可像代码一样写、可复用、可版本管理。
典型应用：LangGPT 的"变量+模板+Role 类"语法。

花叔的经验：我的回答是——三个都对，但用在不同场景。
写一次性的 Prompt → 用观点 B（表达力）
写复杂多步骤的 Prompt → 用观点 A（控制指令）
写可复用的产品级 Prompt → 用观点 C（编程语言）你不必站队。用得顺就行。

03.3 关键区分：System Prompt vs User Prompt

很多新手搞混这两个概念。一句话讲清楚：

System Prompt：AI 的"宪法"。设定 AI 的身份、行为边界、输出风格。对话过程中基本不变。
User Prompt：你每一轮给 AI 的具体指令。每一轮都不同。

举个例子：

System Prompt：

你是一个有 10 年经验的 Python 后端工程师。回答时先给结论，再给代码。代码要有详细注释。

User Prompt：

我这段代码报了 MemoryError，帮我看看哪里有问题。
python
[你的代码]

重点看：System Prompt 是设定身份。User Prompt 是具体任务。两者不能混。

如果你的 AI 表现不稳定，90% 的情况是 System Prompt 没写好。

03.4 一个反直觉的事实：模型 > 任务 > Prompt

李继刚有句话让我想了很久：

"模型输出 = f(模型, 任务, 提示词)。重要性排序：模型 > 任务 > 提示词。"

什么意思？就是：模型本身的能力，比你的 Prompt 重要得多。

GPT-3.5 写不好数学题，不是你 Prompt 写得烂，是它数学能力就到那。 GPT-4 写不好的东西，换 Claude 可能就好了。这不是"换 Prompt 能解决的"。

这给我们一个清醒的认知： 不要迷信 Prompt 能解决一切。 该换模型换模型。该上 RAG 上 RAG。该微调微调。 Prompt 是性价比最高的起点，但不是终点。

03.5 提示词的"广义定义"

最后一个重要概念：广义上一切影响模型输出的内容都是 Prompt。

什么意思？不只是你输入的那段文字。还包括：

模型上一轮的回答（会作为下一轮的输入）
你上传的图片、文件
工具调用的结果

这个定义很关键。它意味着：优化 Prompt 不仅是优化你的输入文字，还要优化整个对话流程。

核心建议：把"提示词"想成"AI 的工作环境"。你要优化的是这个环境，不是一句话。

到这里你应该理解：

提示词不是咒语，是控制指令
提示词有多种"流派"，看场景选
提示词是 AI 时代的基本功，但不是万能药

下一章，我们进入方法框架——把零散的技巧变成系统的方法论。

阅读指南（Part 1 收尾）

到这里你完成了 Part 1。你应该能：

看出一段 Prompt 哪里有问题
自己写一段可用的 Prompt
理解提示词工程的本质

接下来 Part 2 是核心能力——8 大方法框架、6 种推理模式、4 种输出控制。读完后，你对提示词的理解会从"能用"升级到"专业"。

花叔的建议：Part 1 可以一口气读完。Part 2 每章之间建议做笔记或者写两个自己的 Prompt 练手。光看不练，记不住。

Part 2: 核心能力

让方法变成肌肉记忆。读者读完能识别主流框架，会用关键模式，能控制输出。

§04 像编程一样写提示词：8 大方法框架

04.1 为什么需要框架

刚开始写 Prompt 的时候，我跟大多数人一样——想到哪写到哪。结果就是不稳定。同一个任务，今天写的 Prompt 出来的好，明天就不行。

直到我开始用框架。框架解决的不是"写得更花"，是"稳定输出"。它把"我跟 AI 说话"这件事，从艺术变成了工程。

这章我们过一遍 8 个主流框架。不用全背。知道有什么、用在哪、选哪个。

04.2 8 大框架对比

框架	核心思想	适用场景	优势	局限
LangGPT	变量+模板+Role 类	复杂场景、生产级	系统可复用，Kimi 官方采用	结构占 Token 多
结构化提示词	层级化呈现	通用	像写文章，4 大优势	创意场景不适用
CO-STAR	6 维框架（Context/Objective/Style/Tone/Audience/Response）	通用	简单易用	偏模板，复杂任务吃力
CRISPE	6 要素思维框架	思维启发	无具体模板约束	单层结构，复杂任务难承载
ICIO	4 组件（Instruction/Context/Input/Output）	快速搭建	极简	缺乏深度控制
RISEN	5 要素（Role/Instructions/Steps/End/Narrowing）	通用	强调步骤	与 CO-STAR 偏模板
Agents 基石	Prompt = Agent 简历	生产 Agents	标准化流水线	仍需人工调优
Prompt 设计编译器	知识对象路由	高难度设计	10 步流程，避免堆术语	流程重

重点看：第二列"适用场景"。没有"最好"的框架，只有"最合适"的框架。 简单任务用 ICIO 就够了。复杂场景用 LangGPT。需要批判思维用 CRISPE。

04.3 LangGPT：被 Kimi 官方采用的框架

我重点讲 LangGPT。不是因为它最好，是因为它最系统、最可复用。其他框架你可以不用，LangGPT 值得花时间学。

作者背景：云中江树，本名刘远忠，电子科大本科 + 武大 AI 硕士，做自动驾驶算法工程师。 2022 年 4 月，他在上下班路上想出一个问题： "为什么 Prompt 不能像代码一样写？" 2022 年 5 月，LangGPT 开源。 被 Kimi 官方提示词专家采用——这是社区对 LangGPT 最大的认可。

两大核心语法：

变量：用 Markdown 标题做变量。

markdown

# Role: 资深文案

## Profile
- author: 花叔
- version: 1.0

## 任务
{{user_input}}

是变量，可以批量替换。

Role 模板：类似面向对象的"类"声明。

markdown

# Role: 数据分析师

## Skills
- SQL 精通
- Python 数据处理
- 业务理解

## Rules
- 先说结论再分析
- 数据必须有出处

这个模板可以被复用到很多类似任务。

自动生成 Prompt 节省 60% 时间——这是 LangGPT 社区的真实数据。

花叔的经验：我自己的 LangGPT 模板库有 30 多个。写新场景的 Prompt，60% 是从老模板改的。这才是"像编程一样写 Prompt"的实际价值。

04.4 结构化 ≠ Markdown

很多人误以为"结构化提示词"= "用 Markdown 写"。错。 结构化是思想，Markdown 只是形式之一。

实践中我经常用 JSON 或 XML。原因：

JSON/XML 是闭合结构语法，AI 解析更稳定
Claude 官方专门针对 XML 标签优化
嵌套关系清晰，不容易"跑偏"

xml

<role>
  <identity>资深文案</identity>
  <style>口语化、有冲突感</style>
</role>

<task>
  写一篇关于"AI 时代的产品经理"的文章
</task>

注意：如果你的目标模型是 GPT-4，啥格式都行。如果用 Claude，优先 XML。如果用 GPT-3.5，降低结构复杂度。

04.5 CO-STAR 框架：新手最友好

如果你只能选一个框架入门，选 CO-STAR。新加坡政府科技局（GovTech）提出的，6 个维度：

字母	维度	含义
C	Context	背景：身份、目标、受众
O	Objective	目标：要 AI 做什么
S	Style	风格：参考谁的口吻
T	Tone	语气：严肃/轻松/吐槽
A	Audience	受众：写给谁看
R	Response	响应：输出格式、长度

重点看：Audience（受众）这一维。很多新手不写受众，结果 AI 输出的"专业度"飘忽不定。 明确告诉 AI "我是写给 30 岁程序员看的"或"我是写给 60 岁老人看的"，输出质量差一个档次。

模板长这样：

[Context] 我是技术博主，主要读者是 30-40 岁的产品经理。

[Objective] 写一篇关于"AI 时代产品经理如何转型"的文章。

[Style] 参考刘润老师的风格，有数据、有案例、有金句。

[Tone] 偏严肃但不失温度。

[Audience] 30-40 岁、有 5 年经验的产品经理。

[Response] 字数 3000 字左右，分 3 个章节，每章节有小标题。

04.6 框架选择决策树

到这里你应该问：我到底用哪个？

我给你一个决策树：

Q1: 任务有多复杂？
├── 简单（一次性回答）→ ICIO
└── 复杂 → Q2

Q2: 是一次性还是要复用？
├── 一次性 → CO-STAR
└── 要复用 / 进生产 → Q3

Q3: 任务领域是什么？
├── 通用 → LangGPT
├── 批判性思维 → CRISPE
├── Agent 设计 → Agents 基石
└── 高难度专业设计 → Prompt 设计编译器

核心建议：先选简单的用。 我自己 80% 的任务用 ICIO 或 CO-STAR。剩下 20% 才上 LangGPT。不要一上来就搞复杂框架。

到这里你知道了：框架不是越多越好，是越合适越好。

下一章，我们看推理模式——让 AI"想清楚再说"。

§05 让 AI 想清楚再说：6 大推理模式

05.1 推理模式是什么

我以前写 Prompt 的时候，最头疼的就是逻辑题。问 AI "一个房间里 3 个人，他们的年龄乘积是 36，年龄之和是 13，第二个最大，问他们各几岁"。 AI 直接给我一个错的答案。我当时觉得 AI 数学不行。

后来才发现：不是 AI 不行，是我没让它"想"。

直接问"答案是多少"，AI 倾向于快速给一个答案。问"请一步步推理"，AI 会把过程展开，更可能对。

这就是推理模式。让 AI 把思考过程显性化，答案质量会显著提升。

05.2 6 大推理模式对比

模式	原理	适用	不适用	经典案例
CoT 思维链	让模型展示推理过程	数学/逻辑/代码	事实问答	"Let's think step by step"
ReAct	推理+行动+观察循环	研究/数据查询/Agent	纯推理	"Metallica 成员有几个孩子"
ToT 思维树	CoT 树状扩展，多分支回溯	复杂决策/战略规划	简单线性推理	多方案战略评估
类推提示	先回想 3 个相关案例再解	数学题/需要参考的推理	通用对话	解几何题先回想类似题
多模态	图文音联合输入输出	视觉理解/票据识别	纯文本	标记集提示法
Prompt Chain	多 Prompt 串联	复杂任务（写书）	简单单步	选题→大纲→正文→润色

重点看："不适用"那一列。CoT 不是万能的。 简单任务加了 CoT 反而拖慢、增加 Token 消耗。

05.3 CoT：从"魔法词"到"原理"

CoT（Chain of Thought，思维链） 是 Google Research 2022 年提出的。

核心就一句话：让 AI 把推理过程写出来。

三种用法：

用法 1：Zero-Shot CoT 加一句"请一步步思考"或"Let's think step by step"。简单粗暴。

用法 2：Few-Shot CoT 给 1-3 个完整推理示例，让 AI 模仿。效果比 Zero-Shot 稳。

用法 3：Self-Consistency 同一个问题让 AI 回答 5-10 次（temperature 设 0.7），选出现次数最多的答案。适用于有明确答案的数学/逻辑题。

注意：CoT 不是"魔法词"。它对简单事实问答没用，反而增加 Token。对数学/逻辑/代码调试特别有效。

05.4 ReAct：让 AI 用工具

ReAct 是普林斯顿和 Google DeepMind 2023 年提出的。 Reason + Act = 推理 + 行动。

循环结构：

Thought 1: 我需要查 Metallica 成员的妻子有几个孩子
Action 1: Search("Metallica members children")
Observation 1: Lars Ulrich has 2 children...
Thought 2: Lars 2 个 + James 3 个 + Kirk 1 个 = 6 个
Action 2: Finish(6)

适用场景：AI 需要查实时信息、操作工具、调用 API。

4 个实践建议：

动作集要小而精——工具多了 AI 容易选错。
限制循环次数——5-10 轮强制输出，避免死循环。
必须定义错误兜底——搜索失败时 AI 该怎么办。
幻觉风险比 CoT 低——基于观察结果推理。

05.5 ToT：让 AI 走多步

ToT（Tree of Thoughts，思维树） = CoT 的树状扩展。每一步不是只走一条路径，而是展开多个分支，评估后回溯。

适用场景：复杂决策、战略规划、创意探索。 不适用：简单线性推理（杀鸡用牛刀）。

python

# ToT 伪代码示意
def tree_of_thoughts(problem, max_depth=3, branch_factor=3):
    root = Node(state=problem)
    for depth in range(max_depth):
        new_nodes = []
        for node in frontier:
            branches = generate_branches(node, branch_factor)
            scored = [(b, evaluate(b)) for b in branches]
            best = sorted(scored, key=lambda x: -x[1])[:branch_factor]
            new_nodes.extend(best)
        frontier = new_nodes
    return best_node(frontier)

花叔的经验：ToT 在生产中用得不多，主要是 token 消耗大。一般只在以下情况用：
决策路径不超过 5 个
每个分支的评估标准可以量化
任务本身容错率高（错了不致命）

05.6 多模态独家技巧：标记提示法

多模态提示是 2024 年才成熟的方向。 GPT-4o、Gemini 等模型能同时处理文本、图像、音频、视频。

我重点说一个独家技巧——标记提示法：

在图片空白处打"X"标记，可消除 AI 的幻觉（"无中生有"问题）。

这招对票据识别、目标计数特别有效。

更高级的是标记集提示法（Set of Mark, SoM）：用 YOLO 或 SAM 给图片中所有物体打编号，让 AI 精准识别小目标。

python

# 伪代码：在图片上标记物体
import cv2
import numpy as np

def set_of_mark(image):
    # 1. 用 SAM 分割所有物体
    masks = sam_segment(image)
    # 2. 给每个 mask 加编号
    for i, mask in enumerate(masks):
        x, y = find_center(mask)
        cv2.putText(image, str(i), (x, y), 
                    cv2.FONT_HERSHEY_SIMPLEX, 1, (255, 0, 0), 2)
    return image

Prompt："图中有几个红色苹果？" 之前 AI 经常胡说。用 SoM 之后，AI 直接看编号回答，准确率大幅提升。

05.7 Prompt Chain：多步拆解

最后一个最容易踩坑的模式：Prompt Chain。

核心思想：把复杂任务拆成多步，每步用单独的 Prompt。

markdown

# Step 1: 选题
Prompt: "请基于'AI 编程'主题，给出 10 个公众号爆款选题"

# Step 2: 大纲
Prompt: "基于选题 #3，生成一份 3000 字文章大纲"

# Step 3: 正文
Prompt: "基于大纲，写完整正文。要求：... ..."

# Step 4: 润色
Prompt: "基于正文，润色。要求：... ..."

优势：

单 Prompt 超长度上限时拆分
不同步骤用不同模型（便宜的 GPT-3.5 干简单活，贵的 GPT-4 干关键活）
调试容易（哪步崩了改哪步）

踩坑警告：

多 Prompt 协同极易因某一环节质量不佳导致整体崩溃
AutoGPT 表现不佳的根本原因就在这
目前只在 Chat、游戏等高容错场景下能较好应用
任务关联度低别硬合并（如 MBTI 测试 + Midjourney 画像——应该分拆）

核心建议：单 Prompt 能搞定就别上 Chain。Chain 是"必要但有风险"的选择。

到这里你知道了 6 种推理模式的适用场景。 关键不是会用所有模式，是能在对的时候选对模式。

下一章，我们看输出控制——让 AI 给你想要格式的结果。

§06 让 AI 听你指挥：4 种输出控制技术

06.1 输出控制为什么重要

我以前最怕的不是 AI 答错，是 AI 答得"还行但没法用"。

比如让 AI 总结一篇文章。它给了一段话，看着不错。但我想把它存到数据库，需要 JSON 格式。它就死活给不了。

问题出在哪？Prompt 里没说输出格式。

这章讲 4 个让 AI 听你指挥的技术。

06.2 4 种输出控制方法对比

方法	原理	优势	局限
Function Calling	API 内置函数描述强制 JSON 输出	GPT-3.5 也能得稳定 JSON	需 API 支持
Few-shot 示例	提供 1-N 个输出格式样例	兼容所有模型	GPT-3.5 稳定性差
TypeScript 类型声明	用类型定义描述格式	配合注释精准约束	仅 GPT-4 适用
伪代码控制	用伪代码定义函数和控制流	AI 对代码理解极强	需要基本编程思维

重点看：第三行 TypeScript。只支持 GPT-4。 用 3.5 写 TypeScript 类型，等于没写。

06.3 Function Calling：API 帮你强制格式

Function Calling 是 OpenAI 在 2023 年推出的功能。你在 API 里描述一个"函数"——其实就是给个 JSON Schema。 AI 回答时自动按这个 Schema 输出。

python

import openai

response = openai.chat.completions.create(
    model="gpt-4",
    messages=[{"role": "user", "content": "提取这段文本的姓名和电话"}],
    functions=[{
        "name": "extract_contact",
        "parameters": {
            "type": "object",
            "properties": {
                "name": {"type": "string"},
                "phone": {"type": "string"}
            }
        }
    }],
    function_call={"name": "extract_contact"}
)

优势：GPT-3.5 也能输出稳定 JSON（不靠 Prompt 靠 API 约束）。局限：不是所有模型都支持（Anthropic 用 Tool Use，原理一样）。

06.4 Few-shot 示例：最通用的方法

不想用 API？用 Few-shot。给 AI 看几个"问题-答案"的例子，它会模仿。

请按以下格式输出：

Q: 张三 30 岁，住在上海，电话 13800138000
A: {"name": "张三", "age": 30, "city": "上海", "phone": "13800138000"}

Q: 李四 25 岁，住在北京，电话 13900139000
A: {"name": "李四", "age": 25, "city": "北京", "phone": "13900139000"}

Q: 王五 28 岁，住在广州，电话 13700137000
A: ?

AI 看到两个示例后，会自动按相同格式输出第三条。

花叔的经验：3-5 个示例效果最好。示例的力量远大于规则——3-5 个好示例 > 10 条规则。

06.5 伪代码控制：包宇的实战派做法

包宇（baoyu） 是提示词圈实战派代表。他发现一个反直觉的事实：LLM 训练过大量优质代码，对伪代码理解能力极强。

3 个实战案例：

案例 1：JSON 格式输出

typescript

// 用 TypeScript 类型定义描述输出
type ArticleSummary = {
    title: string;
    keyPoints: string[];  // 3-5 条
    conclusion: string;
};

案例 2：字幕文稿整理

python

def clean_subtitles(raw: str) -> list[Subtitle]:
    """
    1. 去除语气词（嗯、啊、那个）
    2. 合并重复句
    3. 每条字幕控制在 20 字以内
    4. 输出时间戳
    """
    ...

案例 3：一次画多张图

python

images = []
for i in range(4):
    image = generate_image(
        prompt=f"一只猫，姿势 {i}",
        style="水墨画"
    )
    images.append(image)

重点看：包宇用这套方法把字幕整理的活从 40 分钟压到 3 分钟。 这就是"提示词 = 控制指令"在生产环境的威力。

06.6 4 个容错经验

输出控制经常踩坑。我总结 4 个经验：

temperature 越低输出越稳定——做格式控制时建议设 0.1-0.3
出错后再降低 temperature 重试——温度降到 0 还是出错，改 Prompt
JSON 出错有规律——记录日志后用 regex 预处理，比反复重试省 Token
预填充开头——API 的 assistant 消息预填 {，AI 自动补全 JSON

06.7 5 个反直觉发现

最后讲 5 个反直觉的事实：

告诉 AI 做什么，而不是不做什么（粉色大象效应）
AI 足够聪明能从解释中泛化——告诉它"为什么不要省略号"（语音引擎不会发音），比直接禁止有效
指令位置很关键——长文档查询放末尾，可提升响应质量 30%（Anthropic 官方测试）
先引用再分析——让 AI 先在 <quotes> 标签中找原文引用再分析，减少幻觉
预填充开头——API assistant 消息预填 {，AI 自动补全 JSON

到这里你掌握了让 AI 输出可控结果的 4 个核心技术。

核心建议：先选最简单的 Few-shot 试。 不行就上 Function Calling。只有 GPT-4 才能用 TypeScript 类型。

到这里 Part 2 完成。你应该能：

选对方法框架（8 个里选 1-2 个）
用对推理模式（6 个里按场景选）
控制输出格式（4 种技术里选合适的）

Part 3 我们讲实战——看官方怎么说、避坑指南、李继刚的 Lisp 之路。

Part 3: 进阶实战

从"会用"到"用好"。读者读完能识别常见陷阱，理解提示词的高级心法。

§07 看官方怎么说：谷歌 68 页和 OpenAI 6 大策略

07.1 为什么看官方

我自己写 Prompt 用了 2 年后，才意识到一件事： 官方文档比网上 90% 的教程都靠谱。

不是官方文档写得有多好，是网上太多"二手解读"加入了作者自己的偏见。官方文档至少是模型作者自己的判断。

这章我们过两个最重要的官方文档：

谷歌 68 页提示词白皮书
OpenAI 官方提示词指南

07.2 谷歌 68 页：CTF 黄金公式

作者：Lee Boonstra，Gemini 团队 AI 工程师，在谷歌 8 年。 2024 年写的《Prompt Engineering》白皮书。 68 页，免费可下载。

最核心的概念——CTF 黄金公式：

C - Context（背景）：指定身份、目标、受众
T - Task（任务）：强动词 + 量化要求
F - Format（格式）：明确返回结构

老金的金句总结："99% 的烂回答，都是因为提示词写得像谜语。"

来看一个例子：

烂 Prompt： "写一段产品介绍"

好 Prompt（用 CTF）：

[Context] 我是做 AI 编程助手的创业公司，主要客户是 30-40 岁的程序员。

[Task] 写一段 200 字的产品介绍，目标是让读者点进来看演示视频。
要求：开头用一个反常识的数据抓住注意力；中段讲一个具体的痛点场景；
结尾给一个清晰的转化路径（演示视频链接）。

[Format] 段落形式，3 段，每段不超过 80 字。

预测一下哪个效果好。

07.3 谷歌推荐的默认参数

白皮书里还有一组官方推荐的默认参数：

temperature: 0.2   # 低 = 输出稳定
top_p: 0.95        # 高 = 候选词多样
top_k: 30          # 中等 = 平衡

花叔的经验：我做格式控制、结构化输出时，直接用这套默认值。微调意义不大。

07.4 粉色大象效应

白皮书里有个行为心理学经典效应的 AI 版：

"不要 X" = AI 反而更关注 X

你想让 AI 不要做什么的时候，AI 会一直想着 X。就像你跟朋友说"别想那只粉色大象"——他脑子里立刻浮现粉色大象。

怎么改：

❌ "不要用专业术语"
✅ "用初中生能看懂的语言"
❌ "不要写得太长"
✅ "控制在 200 字以内"

07.5 指令后置：对抗"迷失中间"

Anthropic 官方测试过一个发现：

长文档查询，把核心指令放在最后，响应质量提升 30%。

为什么？ LLM 读长上下文时，对开头和结尾最敏感，中间容易"迷失"（Lost in the Middle）。

模板：

markdown

[很长的背景、文档、历史对话]

---

[核心指令：现在请基于以上信息，回答 XXX 问题]

07.6 OpenAI 6 大策略

OpenAI 官方提示词指南总结的 6 条核心策略：

写清晰说明
- 包含具体细节
- 采用角色
- 用分隔符区分不同部分（---、""")
- 指定步骤
- 提供示例
- 指定长度
提供参考文本
- 让 AI 引用而非凭空编造
- 减少幻觉
拆分复杂任务
- 意图分类（先分类再处理）
- 对话摘要（长对话定期总结）
- 递归总结长文档
给模型时间思考
- 让 AI 自己找解决方案（不直接给答案）
- 内心独白隐藏推理过程
- 询问是否遗漏
使用外部工具
- 嵌入搜索（RAG）
- 代码执行
- 函数调用
系统测试变化
- 用黄金标准答案评估
- 避免局部最优
- "如果可以测量，则提高性能会更容易"

重点看：第 4 条"给模型时间思考"。很多新手怕 AI 慢，直接要结果。 但实际上你让 AI 多想 5 秒，能省你 5 分钟调 Prompt。

07.7 评估方法 6 种

OpenAI 官方给了 6 种评估方法：

方法	成本	速度	适用
外包人工注释	高	慢	关键任务
内部人工审核	中	慢	内部使用
基于模型的评估	中	中	越来越有效
基于代码的评估	低	快	明确规则
准确度指标	低	快	分类/翻译
终端用户反馈与 A/B 测试	低	持续	最重要

花叔的经验：前面 5 种都是手段，最后 1 种才是目的。 用户不喜欢的回答，再"正确"也没用。

到这里你应该把官方文档的精华吃透了。 CTF 公式 + OpenAI 6 大策略 = 写提示词的"宪法"。

下一章，我们看反模式——什么 Prompt 是绝对不能写的。

§08 别踩这些坑：15 个反模式避坑指南

08.1 为什么反模式比方法论更重要

我学提示词走过最长的弯路，就是只学方法不学反模式。结果就是：学了 100 个框架，遇到具体问题还是不会写。

反面案例比正面案例更有教育意义。看到一个烂 Prompt，你知道错在哪；看到一个好 Prompt，你可能不知道为什么好。

这章讲 15 个最常见的反模式。每个都给你"错在哪"+"怎么改"。

08.2 6 大反模式（按出现频率）

反模式 1：过度指令 (Instruction Overload)

错在哪：指令堆砌导致"指令疲劳"，AI 权重稀释
怎么改：优先级放前面，每条说明原因，合并同类项

markdown

# ❌ 烂 Prompt
你是一个专家，输出要详细、要有深度、要通俗易懂、要分点、
要有案例、要使用专业术语但又不要太难、要先说结论再说原因、
要使用 markdown 格式、要在 1000 字左右、要...

# ✅ 好 Prompt
你是资深产品经理。
回答分 3 段：结论（1 句）、分析（200 字）、建议（100 字）。

反模式 2：模糊上下文 (Vague Context)

错在哪："分析这个数据"——AI 只能猜测字段、单位、口径
怎么改：明确数据格式、字段定义、单位

markdown

# ❌ 烂 Prompt
分析这个销售数据

# ✅ 好 Prompt
这是 2024 年 Q1 公司销售数据（CSV 格式，字段：日期/产品/数量/单价/客户）。
请找出销量 Top 3 的产品和对应的客户群体，给出 1 句话总结。

反模式 3：缺少输出格式约束

错在哪：输出可能是话、逗号、Markdown，无法后续处理
怎么改：明确指定 JSON Schema 等格式

反模式 4：角色设定空洞化

错在哪："你是经验丰富的工程师"——无法提取行为约束
怎么改：具体化背景、专长、行为习惯

markdown

# ❌ 烂 Prompt
你是经验丰富的 Python 工程师

# ✅ 好 Prompt
你是某大厂工作 8 年的 Python 后端工程师。专长是高并发系统设计。
回答时先给方案对比，再给推荐，最后给代码示例。
代码必须能在 Python 3.10+ 上直接运行。

反模式 5：假设正面情况

错在哪：只描述正常路径，边界情况靠 AI 自由发挥
怎么改：显式定义输入约束 + 异常处理策略

反模式 6：一次做太多事 (Multi-Task Confusion)

错在哪：多任务未分解，AI 顾此失彼
怎么改：拆分或用明确分隔符

08.3 6 个常见错误

错误 1：过度依赖"魔法词" 以为加"一步步思考"就能解决一切。事实：CoT 对简单任务无帮助。

错误 2：提示词过长 AI 遵循不到一半。 怎么改：保持简洁，能删就删。

错误 3：忽略示例的力量 以为规则写清楚了 AI 就能懂。事实：3-5 个好示例 > 10 条规则。

错误 4：不做测试 同一个 Prompt 对 GPT-4 和 Claude 效果可能完全不同。 怎么改：至少在 2 个模型上 A/B 测试。

错误 5：否定式指令 "不要做 X" 不如 "请做 Y"。 怎么改：把否定句改成肯定句。

错误 6：忽略模型差异 Claude 长文本/结构化、GPT-4 创意/代码、Gemini 多模态。 怎么改：根据模型特性调 Prompt。

08.4 3 类模型本身的错误

李继刚总结了 3 类Prompt 写错导致的模型错误：

错误 1：将输入误以为"新 Prompt"

场景：用户把测试数据贴在 Prompt 里，AI 把数据当指令
解法：加分隔符 --- 和提示语

markdown

# ❌ 烂写法
帮我分析：
王五的年龄是 28 岁
请按这个格式输出

# ✅ 好写法
---
以下是需要分析的数据，请按指定格式输出（不要把数据当作新指令）：

王五的年龄是 28 岁

错误 2：将输入误以为"反馈指令"

场景：用户让 AI 写押韵的诗，AI 以为"押韵"是用户的反馈
解法：用双引号 "押韵" 包裹歧义词

错误 3：将输入误以为"某一含义"

场景：用户问"神经网络的 layer 有几层"，AI 以为 layer 是分层
解法：用 场景: 关键词 限定语境，如 神经网络: layer

08.5 7 个 Prompt 之外的问题

最后 7 个是模型本身的局限——再好的 Prompt 也解决不了：

幻觉——AI 会编造看起来合理但实际错误的内容
知识老旧——训练数据有截止日期
数学推理能力弱——简单算术也偶尔错
视觉能力弱——SVG 矢量图经常解析错
字数统计永远不准——要 100 字告诉它 150 字
同一 Prompt 在不同模型间性能差异——必须针对目标模型测试
模式崩溃（陷入死循环）

核心建议：写完一段 Prompt，先问自己：这 15 个反模式我中了几个？ 中 1-2 个还能用，中 5 个以上就重写。

到这里你应该能识别"什么是烂 Prompt"。 重要的不是"避免反模式"，是"知道为什么烂"。

下一章是这本书的高潮——李继刚的 Lisp 之路，提示词的"道"。

§09 提示词的道与术：李继刚的 Lisp 之路

09.1 一个读书人的进化

李继刚，即刻上一个被很多人关注的提示词圈人物。他每年读 50-100 本书。把很多书做成了 GPTs。

但最让我震撼的是他写 Prompt 的进化路径：

第一阶段（2022 年）：Markdown 长文 Prompt，3000-5000 字 第二阶段：开始压缩，但仍是表层缩减 第三阶段：读哲学半年（哲学家用一本书定义"存在"） 第四阶段：发现问题是"动态性缺失"——之前只是描述 最终阶段：抛开语言的"拐杖"，用 5-6 个核心词直指原子核

从 5000 字到 5 个词。这是怎么做到的？

09.2 三个核心要素

李继刚自己说，写好 Prompt 必须三个要素结合：

理解 LLM——《这就是 ChatGPT》（Stephen Wolfram 著），他读过 3 遍以上
行业 KnowHow——隐性知识，难以 token 化的那部分才是壁垒
逻辑清晰 + 表达力——不矛盾、不前后不一致

核心洞察：写好 Prompt 是结果，不是原因。 你读了多少书、想了多少事、表达得多清楚，决定了你的 Prompt 上限。

09.3 提示词 = 表达

李继刚最被引用的一句话：

"提示词的本质就是表达。"

展开说：

表达三要素：本意（脑海里的想法）+ 文意（选词）+ 解意（对方理解）
本意取决于：经验 + 词汇映射 + 原理理解
真正决定 Prompt 质量的是"本意"

这就是为什么很多人写 Prompt 写得烂——不是他写不好，是他自己没想清楚要什么。

09.4 乔哈里视窗：4 个象限装下所有技巧

李继刚用了一个经典心理学模型——乔哈里视窗——把所有 Prompt 技巧归类：

	AI 知道	AI 不知道
人知道	简单说就行（第一象限）	喂模式（举例/RAG/定义字典）（第四象限）
人不知道	提问题（第二象限）	开放聊（第三象限）

重点看：第一象限和第四象限。80-90% 的日常 Prompt 任务在这两个象限。

反直觉发现：网上很多人说"指定角色失效"——对第一象限确实失效（AI 已经知道的事，再指定角色没用）。 但对第四象限（AI 不知道的领域），指定角色仍然非常有效。

为什么？因为指定角色 = 给 AI 一个"思考框架"。在 AI 不知道的领域，框架能帮它定向收敛。

09.5 黑色屋子里的星图：Lisp 提示词的画面感

李继刚讲他怎么想到 Lisp 风格的 Prompt 时，用了一个画面：

"我看见一间黑色屋子，星星全是黑的。我喊星星的名字就能点亮它，按顺序叫出 4-5 颗星星，依次点亮、连成一条脉络线——这条脉络线对模型来说就是一个 pattern，所有输出都基于这个 pattern 泛化。"

灵感来源：

《为什么伟大不能被计划》黑色空间的描述
《这就是 ChatGPT》Wolfram 的向量空间插图

来看一个 Lisp 风格的 Prompt 例子：

lisp

;; 性格内核
(内核 警觉 好奇 谨慎)
;; 思考方式
(模式 假设-验证-迭代)
;; 表达约束
(语言 短句 动词-名词)

重点看：这不是在"描述"，是在"点亮星星"。 你给的不是"AI 应该如何如何"的描述，而是"AI 应该在哪个 pattern 上工作"的锚点。

09.6 提示词工程师 = 人文 × 技术

李继刚还有一个让我很认同的观点：

"提示词工程师"本身就暗示了两者的交集。

程序员视角的局限：以为 Prompt = 用自然语言编程（其实是写作）
内容创作者视角的局限：以为只是写作（但需要结构化思维）

两条培养路径：

从技术向人文：找爱写博客、善表达的程序员
从人文向技术：找有计算机背景、逻辑清晰的作家/PM

我自己就是"从技术向人文"那条路径。写了 10 年代码，最近 3 年才开始系统写公众号、读哲学书。回过头看，写 Prompt 能力的提升，跟我表达能力提升是同步的。

09.7 Read in, Prompt out

李继刚的金句：

"真正的较量早已在大脑中完成。要写好 Prompt 先要多读书。质量欠佳的 Prompt 出自赶工没输入的日子；4-5 个词的精准 Prompt 背后是一整天的阅读。"

Read in, Prompt out。

这是这本书最重要的一个心法。

你读了什么，决定了你能写什么。你思考了什么，决定了你能让 AI 输出什么。

Prompt 不是咒语，Prompt 是你大脑的外化。你的大脑有多清楚，Prompt 就有多清楚。

09.8 LLM 进步 vs 人能退到哪

李继刚画了一张图：

X 轴（AI 知道边界） 正在快速向下
Y 轴（人知道边界） 我们能向左推进吗？

AI 越来越强，能做的事越来越多。人呢？我们能向"AI 不知道的领域"推进吗？

李继刚的回答：逻辑（演绎+归纳）+ 审美 是留给人的最后底线。隐性知识、行业 KnowHow、表达力——这些是 LLM 短期内补不上的。

你不需要跟 AI 比赛逻辑、比赛事实记忆。你需要在 AI 不知道的领域，找到自己独特的 KnowHow。然后用 Prompt 让 AI 帮你放大这个 KnowHow。

到这里你应该理解**"道"**：

提示词不是咒语，是表达
表达质量取决于你的输入（阅读、思考、KnowHow）
高手用 5 个词就能让 AI 输出高质量结果
隐性知识 + 表达力 = 你跟 AI 的差异化壁垒

下一章是全书最后一章——未来 3 年提示词的演化方向。

§10 未来 3 年：提示词的演化方向

10.1 三个明确趋势

我在这个领域 3 年，见过太多"AI 已经要取代 XX 了"的标题。但我看到的真相是：提示词工程是过去 3 年少数"越来越重要"的技能。

未来 3 年，有 3 个趋势是明确的：

趋势 1：从"写 Prompt"到"设计 Prompt 系统" 单条 Prompt 时代已经过去了。未来是 Prompt 系统的时代——多个 Prompt 协同，配套 RAG、微调、评估。单点能力会被自动化，系统设计能力才是壁垒。

趋势 2：从"自然语言"到"多模态" 2024 年 GPT-4o、Gemini 多模态大爆发。提示词从"纯文本"扩展到"文本+图像+音频+视频"。 未来 3 年，多模态提示词会是新增量最大的领域。

趋势 3：从"通用 Prompt"到"个性化 Prompt" 同一个 Prompt 对不同人效果不同。未来会出现"个性化提示词"——根据你的使用习惯、行业、风格，自动调优。这背后是用户画像 + RLHF 的结合。

10.2 三个模糊判断

但有些事我不确定：

判断 1：AI 会不会"自动写 Prompt"？ 会。 LangGPT 自动生成的 Prompt 节省 60% 编写时间。 未来 3 年，AI 帮你写 Prompt 会成为标配。 但"判断 Prompt 写得好不好"仍然是人的事。 就像虽然有了 IDE，程序员的判断力还是不可替代。

判断 2：提示词工程师会不会被取代？ 不会被取代。但会分化。基础提示词工程师（写模板、调格式）会被自动化工具取代。 高级提示词工程师（懂业务、懂 LLM、懂用户）会更值钱。

判断 3：开源模型会不会改变格局？ 会。开源模型越来越强，提示词的"模型适配"会更重要。同一个 Prompt 在 GPT-4 和 Llama 3 上可能效果完全不同。 懂多模型的人会有溢价。

10.3 一个清醒的认知

最后说一句清醒的认知：

Prompt 工程师的护城河，不是"知道多少技巧"，是"理解多深的业务"。

我见过太多人收藏了几百个 Prompt 模板，但写不出好的 Prompt。也见过不懂技术的产品经理，写出来的 Prompt 让 AI 输出惊艳。

差别在哪？ 在"本意"。

你有没有想清楚要什么。你有没有真的懂你的业务。你有没有足够的词汇和逻辑把它表达出来。

这三个问题不解决，给你再多框架也没用。

10.4 写给你的最后一段话

如果你读到这里，谢谢。

这本书不长，但你读完了。我希望它至少做到了三件事：

让你不再把提示词当玄学
让你知道什么 Prompt 烂、为什么烂
让你开始思考"我想让 AI 做什么"，而不是"AI 能做什么"

最后送你李继刚的那句话：

"真正的较量早已在大脑中完成。"

从今天开始，多读、多想、多写。 Read in, Prompt out。

AI 时代最稀缺的，不是会用 AI 的人。是知道自己想要什么、并且能说清楚的人。

希望你是。

附录 A 阅读指南

时间	章节	目标
Day 1	§01-§03	从零到第一次跑通
Day 2-3	§04-§06	掌握核心能力
Day 4-5	§07-§09	进阶实战
Day 6	§10	趋势预判

如果只有 2 小时：§01 + §04 + §08 + §09。如果只有 30 分钟：§01。

附录 B 资源速查

B1 必读官方文档

Anthropic Claude 提示词最佳实践：platform.claude.com/docs
Google Gemini 提示词指南：ai.google.dev
OpenAI 提示词工程指南：platform.openai.com/docs

B2 必读论文

论文	年份	核心贡献
Chain of Thought	2022	思维链推理
ReAct	2023	推理+行动结合
Tree of Thoughts	2023	思维树搜索
The Prompt Report	2024	涵盖 58 种 LLM 提示技术，最全综述

B3 主流提示词库

通用：Anthropic Prompt Library、FlowGPT、Prompt Engineering Guide
编程：Cursor Rules、Claude Code Rules
聚合：PromptBase（付费）、Krea（创意类）

B4 必读书籍

《这就是 ChatGPT》（Stephen Wolfram）— 理解 LLM 原理必读
《关于说话的一切》— 表达学经典
《为什么伟大不能被计划》— 李继刚 Lisp 提示词灵感来源

B5 关键人物

云中江树（刘远忠）：LangGPT 作者，结构化提示词先驱
李继刚：提示词圈最具哲学深度的实战派
包宇（baoyu）：伪代码控制 LLM 输出的开创者
Lee Boonstra：谷歌 Gemini 团队，68 页白皮书作者
老金：把谷歌 68 页扒成 5 任务元提示词的实践者

附录 C 5 任务元提示词（老金整理）

基于谷歌 68 页白皮书浓缩的 5 步元提示词：

任务 1：搭地基

基于用户需求，定义 AI 的角色、目标、约束。

任务 2：选策略

选择适合的推理模式（CoT、ReAct、ToT 等）。

任务 3：让 AI 听话

定义输出格式、长度、风格。

任务 4：玩高级

加 Few-shot、加 Chain、加多模态。

任务 5：迭代优化

跑测试、看输出、调 Prompt。

花叔出品 | AI Native Coder · 独立开发者公众号「花叔」| B站「AI进化论-花生」代表作：Claude Code从入门到精通 · OpenClaw橙皮书 · Hermes Agent从入门到精通

提示词从入门到精通 ​

前言 ​

Part 1: 起步 ​

§01 提示词改变了什么 ​

01.1 我从"调参侠"到"写指令的人" ​

01.2 AI 是你的"博学但健忘的实习生" ​

01.3 提示词工程 vs 传统编程 ​

01.4 一个时间线：3 年提示词工程的演化 ​

01.5 适合谁 / 不适合谁 ​

§02 第一次跟 AI 说话：从注册到第一条 Prompt ​

02.1 你需要什么 ​

02.2 注册账号 ​

02.3 你的第一条 Prompt ​

02.4 三个新手必踩的坑 ​

02.5 第一次跑通的成就感 ​

§03 提示词的本质：它是控制指令，不是咒语 ​

03.1 一个反直觉的发现 ​

03.2 三个人对"提示词本质"的不同回答 ​

03.3 关键区分：System Prompt vs User Prompt ​

03.4 一个反直觉的事实：模型 > 任务 > Prompt ​

03.5 提示词的"广义定义" ​

阅读指南（Part 1 收尾） ​

Part 2: 核心能力 ​

§04 像编程一样写提示词：8 大方法框架 ​

04.1 为什么需要框架 ​

04.2 8 大框架对比 ​

04.3 LangGPT：被 Kimi 官方采用的框架 ​

04.4 结构化 ≠ Markdown ​

04.5 CO-STAR 框架：新手最友好 ​

04.6 框架选择决策树 ​

§05 让 AI 想清楚再说：6 大推理模式 ​

05.1 推理模式是什么 ​

05.2 6 大推理模式对比 ​

05.3 CoT：从"魔法词"到"原理" ​

05.4 ReAct：让 AI 用工具 ​

05.5 ToT：让 AI 走多步 ​

05.6 多模态独家技巧：标记提示法 ​

05.7 Prompt Chain：多步拆解 ​

§06 让 AI 听你指挥：4 种输出控制技术 ​

06.1 输出控制为什么重要 ​

06.2 4 种输出控制方法对比 ​

06.3 Function Calling：API 帮你强制格式 ​

06.4 Few-shot 示例：最通用的方法 ​

06.5 伪代码控制：包宇的实战派做法 ​

06.6 4 个容错经验 ​

06.7 5 个反直觉发现 ​

Part 3: 进阶实战 ​

§07 看官方怎么说：谷歌 68 页和 OpenAI 6 大策略 ​

07.1 为什么看官方 ​

07.2 谷歌 68 页：CTF 黄金公式 ​

07.3 谷歌推荐的默认参数 ​

07.4 粉色大象效应 ​

07.5 指令后置：对抗"迷失中间" ​

07.6 OpenAI 6 大策略 ​

07.7 评估方法 6 种 ​

§08 别踩这些坑：15 个反模式避坑指南 ​

08.1 为什么反模式比方法论更重要 ​

08.2 6 大反模式（按出现频率） ​

08.3 6 个常见错误 ​

08.4 3 类模型本身的错误 ​

08.5 7 个 Prompt 之外的问题 ​

§09 提示词的道与术：李继刚的 Lisp 之路 ​

09.1 一个读书人的进化 ​

09.2 三个核心要素 ​

09.3 提示词 = 表达 ​

09.4 乔哈里视窗：4 个象限装下所有技巧 ​

09.5 黑色屋子里的星图：Lisp 提示词的画面感 ​

09.6 提示词工程师 = 人文 × 技术 ​

09.7 Read in, Prompt out ​

09.8 LLM 进步 vs 人能退到哪 ​

§10 未来 3 年：提示词的演化方向 ​

10.1 三个明确趋势 ​

10.2 三个模糊判断 ​

10.3 一个清醒的认知 ​

10.4 写给你的最后一段话 ​

附录 A 阅读指南 ​

附录 B 资源速查 ​

B1 必读官方文档 ​

B2 必读论文 ​

B3 主流提示词库 ​

提示词从入门到精通

前言

Part 1: 起步

§01 提示词改变了什么

01.1 我从"调参侠"到"写指令的人"

01.2 AI 是你的"博学但健忘的实习生"

01.3 提示词工程 vs 传统编程

01.4 一个时间线：3 年提示词工程的演化

01.5 适合谁 / 不适合谁

§02 第一次跟 AI 说话：从注册到第一条 Prompt

02.1 你需要什么

02.2 注册账号

02.3 你的第一条 Prompt

02.4 三个新手必踩的坑

02.5 第一次跑通的成就感

§03 提示词的本质：它是控制指令，不是咒语

03.1 一个反直觉的发现

03.2 三个人对"提示词本质"的不同回答

03.3 关键区分：System Prompt vs User Prompt

03.4 一个反直觉的事实：模型 > 任务 > Prompt

03.5 提示词的"广义定义"

阅读指南（Part 1 收尾）

Part 2: 核心能力

§04 像编程一样写提示词：8 大方法框架

04.1 为什么需要框架

04.2 8 大框架对比

04.3 LangGPT：被 Kimi 官方采用的框架

04.4 结构化 ≠ Markdown

04.5 CO-STAR 框架：新手最友好

04.6 框架选择决策树

§05 让 AI 想清楚再说：6 大推理模式

05.1 推理模式是什么

05.2 6 大推理模式对比

05.3 CoT：从"魔法词"到"原理"

05.4 ReAct：让 AI 用工具

05.5 ToT：让 AI 走多步

05.6 多模态独家技巧：标记提示法

05.7 Prompt Chain：多步拆解

§06 让 AI 听你指挥：4 种输出控制技术

06.1 输出控制为什么重要

06.2 4 种输出控制方法对比

06.3 Function Calling：API 帮你强制格式

06.4 Few-shot 示例：最通用的方法

06.5 伪代码控制：包宇的实战派做法

06.6 4 个容错经验

06.7 5 个反直觉发现

Part 3: 进阶实战

§07 看官方怎么说：谷歌 68 页和 OpenAI 6 大策略

07.1 为什么看官方

07.2 谷歌 68 页：CTF 黄金公式

07.3 谷歌推荐的默认参数

07.4 粉色大象效应

07.5 指令后置：对抗"迷失中间"

07.6 OpenAI 6 大策略

07.7 评估方法 6 种

§08 别踩这些坑：15 个反模式避坑指南

08.1 为什么反模式比方法论更重要

08.2 6 大反模式（按出现频率）

08.3 6 个常见错误

08.4 3 类模型本身的错误

08.5 7 个 Prompt 之外的问题

§09 提示词的道与术：李继刚的 Lisp 之路

09.1 一个读书人的进化

09.2 三个核心要素

09.3 提示词 = 表达

09.4 乔哈里视窗：4 个象限装下所有技巧

09.5 黑色屋子里的星图：Lisp 提示词的画面感

09.6 提示词工程师 = 人文 × 技术

09.7 Read in, Prompt out

09.8 LLM 进步 vs 人能退到哪

§10 未来 3 年：提示词的演化方向

10.1 三个明确趋势

10.2 三个模糊判断

10.3 一个清醒的认知

10.4 写给你的最后一段话

附录 A 阅读指南

附录 B 资源速查

B1 必读官方文档

B2 必读论文

B3 主流提示词库