Skip to content

提示词从入门到精通

A Complete Guide from Beginner to Master

创建者: 花叔 为谁创建: 每天用 AI 的人——产品、运营、程序员、设计师,以及想搞懂"为啥 AI 不听话"的所有人 基于: OpenAI / Anthropic / Google 三大官方指南 + LangGPT 社区 32 篇实战内容 最后更新: 2026-06-05 适用场景: 写 Prompt 卡壳时翻一翻,想系统学提示词时从头读


前言

我用 AI 大概 3 年了。 从最开始的 ChatGPT,到现在的 Claude Code、Cursor、各种 Agent。 前两年我一直在做"调参侠"——同样的问题换个说法问三遍,看哪个回答能用。 这个状态大概持续到 2024 年初。

转折点有两次。 第一次是读到李继刚的"提示词 = 表达"那句话。 第二次是我自己用一个伪代码控制 LLM 的技巧,把字幕整理的活从 40 分钟压到 3 分钟。 那一刻我才意识到:我之前没学会跟 AI 说话,不是因为 AI 不够聪明,是我自己没说清楚。

这本书就是从那次觉悟开始写的。 我没有堆理论,没有抄论文。 就是把过去 3 年踩过的坑、用过的方法、读过的内容,全部摊开给你看。

读完你能做到三件事:

  • 看一段 Prompt,能立刻判断它哪里有问题
  • 拿到一个新场景,能在 10 分钟内写出第一版可用的提示词
  • 知道什么时候该优化 Prompt,什么时候该上 RAG,什么时候该微调

不保证你成为提示词大师。 但保证你少走我走过的弯路。

花叔的经验:这本书适合两类人。 一类是刚接触 AI 不知道从何下手。读 Part 1 起步就够了。 一类是用了 AI 一段时间但总觉得"差点意思"。重点看 Part 2 和 Part 3。


Part 1: 起步

从零到一。读者读完能写出第一条可用的提示词。

§01 提示词改变了什么

01.1 我从"调参侠"到"写指令的人"

2022 年底 ChatGPT 出来的时候,我跟大多数人一样兴奋。 试着写代码、写信、做总结。 结果经常被 AI 气得想砸键盘。

最常见的场景是: 我问"帮我写一个 Python 函数,把列表里大于 10 的数过滤出来"。 AI 给我回了一段代码,但用了 lambda 表达式,还有几个我查文档才认出来的库。 我想要的是 for item in lst: if item > 10: ... 这种最直白的版本。 我问了三遍,每遍的回答都不一样。 我以为是 AI 的问题。

直到 2024 年,我才搞明白一件事: 不是 AI 不听话,是我没说清楚我要什么。 我应该说"用最朴素的写法,不要 lambda,不要额外依赖,初学者能看懂"。 一句话的事。我之前没意识到。

这就是这本书要解决的核心问题。

01.2 AI 是你的"博学但健忘的实习生"

谷歌那本 68 页提示词白皮书里有个比喻,我觉得最到位: AI 就像一个博学但刚入职、还有点健忘的超级实习生。

展开说:

  • 博学:训练数据覆盖了人类大部分公开知识。问他历史、科学、编程,几乎都能答。
  • 刚入职:不知道你公司的业务、你的偏好、你的边界。
  • 健忘:对话超过一定长度,会忘掉前面说过的话。

理解这个比喻,写 Prompt 就有底了。 你跟新同事布置任务,会怎么做? 会告诉他背景、目标、要求、输出格式。 提示词工程,本质上就是把这种"跟人说话"的方式结构化,喂给 AI。

01.3 提示词工程 vs 传统编程

很多人会把写 Prompt 当成"用自然语言编程"。 我觉得这个比喻对一半。

维度传统编程提示词工程
控制方式代码指令(确定性)自然语言(概率性)
调试方式print / 断点 / 单测迭代优化、A/B 测试
学习曲线陡峭但有边界平缓但深度无限
错误模式编译报错、运行时崩溃答非所问、胡说八道

重点看:学习曲线那一行。传统编程学到头就是学完所有库和框架。但提示词工程没有"学完"这件事——模型在变、任务在变、最佳实践一直在变。

写 Prompt 不是把传统编程"翻译"成自然语言。 是另一种沟通。 你越会说人话,AI 越会说人话。

01.4 一个时间线:3 年提示词工程的演化

  • 2019-2022 萌芽期:Few-shot、CoT 等基础技巧出现在论文里
  • 2022 年 4 月:云中江树在上下班路上想到结构化提示词方法
  • 2022 年 5 月:LangGPT 开源
  • 2022 年底:ChatGPT 横空出世,Prompt 大爆发
  • 2023 年:LangGPT / CO-STAR / CRISPE 等结构化框架成熟
  • 2024 年:The Prompt Report 综述涵盖 58 种提示技术
  • 2024 年至今:Agent、多模态、系统化提示词工程

你看到的是一个清晰的趋势: 从零散技巧 → 框架化方法论 → 系统化工程。 写 Prompt 从"碰运气"变成了"可学习、可复用、可衡量"的技能。

核心建议:如果你刚开始学,不要追新框架。先把"跟 AI 说清楚话"这件事练扎实。所有的框架、模板、工具,都是为了这个目标服务。

01.5 适合谁 / 不适合谁

这本书适合

  • 每天用 AI 但经常觉得"差点意思"的人
  • 想把 AI 嵌入工作流,但不知道如何稳定输出的人
  • 对写 Prompt 感兴趣,但被网上零散资料劝退的人

这本书不适合

  • 想找"魔法词"让 AI 立刻变聪明的人(不存在这种东西)
  • 想做 AGI / 训练基础模型的人(这是另一本书的事)
  • 期待看完就能年薪百万的人(能涨薪,但没那么夸张)

到这里你应该清楚:提示词工程不是玄学,是一门可以学的沟通技能。

下一章,我们直接动手——注册账号、第一次跟 AI 说话。


§02 第一次跟 AI 说话:从注册到第一条 Prompt

02.1 你需要什么

  • 一个能上网的电脑或手机
  • 一个邮箱(用来注册账号)
  • 大概 30 分钟

本章用 ChatGPT 做演示。 但 Claude、Gemini、文心、通义都一样。 道理是相通的。

02.2 注册账号

第一步:打开 chat.openai.com

第二步:点击 Sign Up,输入邮箱。 预期结果:进入手机验证页面。

第三步:输入手机号,接收验证码。 预期结果:进入对话页面。

注意:国内手机号可能注册不成功,需要国外号码或者用第三方登录。我自己用的是 Google 账号登录。

第四步:选择模型。 默认是 GPT-4o 或者更新的模型。 不要选 GPT-3.5。

花叔的经验:3.5 跟 4 的差距,不是"稍微差点",是"差一个时代"。做演示可以,上生产用 3.5 是给自己挖坑。

02.3 你的第一条 Prompt

页面中间有个输入框。 我们写第一条 Prompt。

不要这样写: "写一首诗"

AI 会给你一首很普通的诗。 五言七言你自己选。 但你想要什么风格的?写什么主题?给谁看? AI 不知道。

应该这样写: "请写一首七言绝句。主题是'程序员加班到深夜看见日出'。押平水韵。"

预期结果:AI 会给你一首稍微靠谱点的诗。

再加一层

"我是程序员,30 岁。读到这首诗会有共鸣。不要用'代码如诗'这种烂梗。"

预期结果:AI 这次写得明显更有"人味"。

你看,同样的任务,Prompt 越具体,输出越稳定。 这就是写 Prompt 的核心:把你脑子里的上下文,喂给 AI。

02.4 三个新手必踩的坑

坑 1:把 AI 当许愿机

"帮我写一篇爆款公众号文章"——AI 不知道你账号的调性、你的读者画像、你想要的转化路径。 它只能给你一个平均水平的答案。

怎么改:把约束条件全部写出来。 "我是写 AI 编程内容的公众号。读者是 30-40 岁的程序员。标题要有冲突感但不要标题党。开头先讲一个具体场景。"

坑 2:否定句太多

"不要用专业术语"、"不要长句子"、"不要用列表"——AI 看到"不要 X"的时候,反而会关注 X(粉色大象效应)。 这是行为心理学里一个经典发现。

怎么改:把否定句改成肯定句。 不要说"不要用专业术语",说"用初中生能看懂的语言"。

坑 3:对话越来越长就跑偏

跟 AI 聊了 20 轮之后,你会发现它开始"忘记"最开始说过的话。 这是 LLM 的本质限制——上下文窗口有上限。

怎么改:长任务拆成几步,每步用清晰的 Prompt 重新启动。 这个我们 §06 详细讲。

02.5 第一次跑通的成就感

到这里你应该已经成功让 AI 给你写了一首不那么烂的诗。 或者做了个不那么离谱的总结。 或者改了一段不那么别扭的英文。

这个感觉很重要。 它证明了一件事:你跟 AI 之间的沟通瓶颈,不在 AI,在你的 Prompt。

下面我们开始系统讲方法。

核心建议:接下来 3 章,把所有方法都过一遍。不需要背下来,只需要知道"原来还能这样"。用的时候回来查。


§03 提示词的本质:它是控制指令,不是咒语

03.1 一个反直觉的发现

很多人把"提示词工程"想得很玄学。 觉得是某种"魔法词"——加一句"让我们一步步思考",AI 就变聪明了。 加一句"你是一个专家",AI 就专业了。

我刚开始也这么干。 后来读到一篇文章,说**"深呼吸"这个词只对谷歌的 PaLM 模型有效**。 同样的 Prompt 放到 GPT 上,完全没用。

那个瞬间我意识到:"魔法词"这个概念是错的。

提示词不是咒语。 提示词是对 AI 的控制指令。 形式不限于自然语言。 伪代码、JSON、XML、Markdown——AI 都能理解。 只要你把它当成"给 AI 的指令"来写,而不是"对 AI 的祈祷"。

03.2 三个人对"提示词本质"的不同回答

学界和社区对"提示词是什么"有三种主流回答。 我把它列出来,你自己判断哪个更对。

观点 A:提示词是控制指令(包宇/baoyu)

  • 代表人物:包宇,做过多个提示词工程实战项目
  • 核心观点:Prompt 形式不限于自然语言。LLM 训练过大量代码,对伪代码理解能力极强
  • 典型应用:用 TypeScript 类型定义描述输出格式,比自然语言更精准。

观点 B:提示词是表达(李继刚)

  • 代表人物:李继刚,提示词圈最被推崇的实战派
  • 核心观点:"提示词的本质就是表达。"
  • 典型应用:从 5000 字 Markdown 长文,进化到 5-6 个核心词。

观点 C:提示词是 AI 时代的编程语言(云中江树)

  • 代表人物:云中江树,LangGPT 作者
  • 核心观点:Prompt 可像代码一样写、可复用、可版本管理。
  • 典型应用:LangGPT 的"变量+模板+Role 类"语法。

花叔的经验:我的回答是——三个都对,但用在不同场景。

  • 写一次性的 Prompt → 用观点 B(表达力)
  • 写复杂多步骤的 Prompt → 用观点 A(控制指令)
  • 写可复用的产品级 Prompt → 用观点 C(编程语言) 你不必站队。用得顺就行。

03.3 关键区分:System Prompt vs User Prompt

很多新手搞混这两个概念。 一句话讲清楚:

  • System Prompt:AI 的"宪法"。设定 AI 的身份、行为边界、输出风格。对话过程中基本不变。
  • User Prompt:你每一轮给 AI 的具体指令。每一轮都不同。

举个例子:

System Prompt:

你是一个有 10 年经验的 Python 后端工程师。回答时先给结论,再给代码。代码要有详细注释。

User Prompt:

我这段代码报了 MemoryError,帮我看看哪里有问题。

python
[你的代码]

重点看:System Prompt 是设定身份。User Prompt 是具体任务。两者不能混。

如果你的 AI 表现不稳定,90% 的情况是 System Prompt 没写好。

03.4 一个反直觉的事实:模型 > 任务 > Prompt

李继刚有句话让我想了很久:

"模型输出 = f(模型, 任务, 提示词)。重要性排序:模型 > 任务 > 提示词。"

什么意思? 就是:模型本身的能力,比你的 Prompt 重要得多。

GPT-3.5 写不好数学题,不是你 Prompt 写得烂,是它数学能力就到那。 GPT-4 写不好的东西,换 Claude 可能就好了。 这不是"换 Prompt 能解决的"。

这给我们一个清醒的认知: 不要迷信 Prompt 能解决一切。 该换模型换模型。该上 RAG 上 RAG。该微调微调。 Prompt 是性价比最高的起点,但不是终点。

03.5 提示词的"广义定义"

最后一个重要概念:广义上一切影响模型输出的内容都是 Prompt。

什么意思? 不只是你输入的那段文字。 还包括:

  • 模型上一轮的回答(会作为下一轮的输入)
  • 你上传的图片、文件
  • 工具调用的结果

这个定义很关键。 它意味着:优化 Prompt 不仅是优化你的输入文字,还要优化整个对话流程。

核心建议:把"提示词"想成"AI 的工作环境"。你要优化的是这个环境,不是一句话。

到这里你应该理解:

  • 提示词不是咒语,是控制指令
  • 提示词有多种"流派",看场景选
  • 提示词是 AI 时代的基本功,但不是万能药

下一章,我们进入方法框架——把零散的技巧变成系统的方法论。


阅读指南(Part 1 收尾)

到这里你完成了 Part 1。 你应该能:

  • 看出一段 Prompt 哪里有问题
  • 自己写一段可用的 Prompt
  • 理解提示词工程的本质

接下来 Part 2 是核心能力——8 大方法框架、6 种推理模式、4 种输出控制。 读完后,你对提示词的理解会从"能用"升级到"专业"。

花叔的建议:Part 1 可以一口气读完。Part 2 每章之间建议做笔记或者写两个自己的 Prompt 练手。光看不练,记不住。


Part 2: 核心能力

让方法变成肌肉记忆。读者读完能识别主流框架,会用关键模式,能控制输出。

§04 像编程一样写提示词:8 大方法框架

04.1 为什么需要框架

刚开始写 Prompt 的时候,我跟大多数人一样——想到哪写到哪。 结果就是不稳定。 同一个任务,今天写的 Prompt 出来的好,明天就不行。

直到我开始用框架。 框架解决的不是"写得更花",是"稳定输出"。 它把"我跟 AI 说话"这件事,从艺术变成了工程。

这章我们过一遍 8 个主流框架。 不用全背。知道有什么、用在哪、选哪个。

04.2 8 大框架对比

框架核心思想适用场景优势局限
LangGPT变量+模板+Role 类复杂场景、生产级系统可复用,Kimi 官方采用结构占 Token 多
结构化提示词层级化呈现通用像写文章,4 大优势创意场景不适用
CO-STAR6 维框架(Context/Objective/Style/Tone/Audience/Response)通用简单易用偏模板,复杂任务吃力
CRISPE6 要素思维框架思维启发无具体模板约束单层结构,复杂任务难承载
ICIO4 组件(Instruction/Context/Input/Output)快速搭建极简缺乏深度控制
RISEN5 要素(Role/Instructions/Steps/End/Narrowing)通用强调步骤与 CO-STAR 偏模板
Agents 基石Prompt = Agent 简历生产 Agents标准化流水线仍需人工调优
Prompt 设计编译器知识对象路由高难度设计10 步流程,避免堆术语流程重

重点看:第二列"适用场景"。没有"最好"的框架,只有"最合适"的框架。 简单任务用 ICIO 就够了。复杂场景用 LangGPT。需要批判思维用 CRISPE。

04.3 LangGPT:被 Kimi 官方采用的框架

我重点讲 LangGPT。 不是因为它最好,是因为它最系统、最可复用。 其他框架你可以不用,LangGPT 值得花时间学。

作者背景:云中江树,本名刘远忠,电子科大本科 + 武大 AI 硕士,做自动驾驶算法工程师。 2022 年 4 月,他在上下班路上想出一个问题: "为什么 Prompt 不能像代码一样写?" 2022 年 5 月,LangGPT 开源。 被 Kimi 官方提示词专家采用——这是社区对 LangGPT 最大的认可。

两大核心语法

  1. 变量:用 Markdown 标题做变量。

    markdown
    # Role: 资深文案
    
    ## Profile
    - author: 花叔
    - version: 1.0
    
    ## 任务
    {{user_input}}
    

    是变量,可以批量替换。

  2. Role 模板:类似面向对象的"类"声明。

    markdown
    # Role: 数据分析师
    
    ## Skills
    - SQL 精通
    - Python 数据处理
    - 业务理解
    
    ## Rules
    - 先说结论再分析
    - 数据必须有出处
    

    这个模板可以被复用到很多类似任务。

自动生成 Prompt 节省 60% 时间——这是 LangGPT 社区的真实数据。

花叔的经验:我自己的 LangGPT 模板库有 30 多个。写新场景的 Prompt,60% 是从老模板改的。这才是"像编程一样写 Prompt"的实际价值。

04.4 结构化 ≠ Markdown

很多人误以为"结构化提示词"= "用 Markdown 写"。 错。 结构化是思想,Markdown 只是形式之一。

实践中我经常用 JSON 或 XML。 原因:

  • JSON/XML 是闭合结构语法,AI 解析更稳定
  • Claude 官方专门针对 XML 标签优化
  • 嵌套关系清晰,不容易"跑偏"
xml
<role>
  <identity>资深文案</identity>
  <style>口语化、有冲突感</style>
</role>

<task>
  写一篇关于"AI 时代的产品经理"的文章
</task>

注意:如果你的目标模型是 GPT-4,啥格式都行。如果用 Claude,优先 XML。如果用 GPT-3.5,降低结构复杂度。

04.5 CO-STAR 框架:新手最友好

如果你只能选一个框架入门,选 CO-STAR。 新加坡政府科技局(GovTech)提出的,6 个维度:

字母维度含义
CContext背景:身份、目标、受众
OObjective目标:要 AI 做什么
SStyle风格:参考谁的口吻
TTone语气:严肃/轻松/吐槽
AAudience受众:写给谁看
RResponse响应:输出格式、长度

重点看:Audience(受众)这一维。很多新手不写受众,结果 AI 输出的"专业度"飘忽不定。 明确告诉 AI "我是写给 30 岁程序员看的"或"我是写给 60 岁老人看的",输出质量差一个档次。

模板长这样:

[Context] 我是技术博主,主要读者是 30-40 岁的产品经理。

[Objective] 写一篇关于"AI 时代产品经理如何转型"的文章。

[Style] 参考刘润老师的风格,有数据、有案例、有金句。

[Tone] 偏严肃但不失温度。

[Audience] 30-40 岁、有 5 年经验的产品经理。

[Response] 字数 3000 字左右,分 3 个章节,每章节有小标题。

04.6 框架选择决策树

到这里你应该问:我到底用哪个?

我给你一个决策树:

Q1: 任务有多复杂?
├── 简单(一次性回答)→ ICIO
└── 复杂 → Q2

Q2: 是一次性还是要复用?
├── 一次性 → CO-STAR
└── 要复用 / 进生产 → Q3

Q3: 任务领域是什么?
├── 通用 → LangGPT
├── 批判性思维 → CRISPE
├── Agent 设计 → Agents 基石
└── 高难度专业设计 → Prompt 设计编译器

核心建议先选简单的用。 我自己 80% 的任务用 ICIO 或 CO-STAR。剩下 20% 才上 LangGPT。不要一上来就搞复杂框架。

到这里你知道了:框架不是越多越好,是越合适越好。

下一章,我们看推理模式——让 AI"想清楚再说"。


§05 让 AI 想清楚再说:6 大推理模式

05.1 推理模式是什么

我以前写 Prompt 的时候,最头疼的就是逻辑题。 问 AI "一个房间里 3 个人,他们的年龄乘积是 36,年龄之和是 13,第二个最大,问他们各几岁"。 AI 直接给我一个错的答案。 我当时觉得 AI 数学不行。

后来才发现:不是 AI 不行,是我没让它"想"。

直接问"答案是多少",AI 倾向于快速给一个答案。 问"请一步步推理",AI 会把过程展开,更可能对。

这就是推理模式。 让 AI 把思考过程显性化,答案质量会显著提升。

05.2 6 大推理模式对比

模式原理适用不适用经典案例
CoT 思维链让模型展示推理过程数学/逻辑/代码事实问答"Let's think step by step"
ReAct推理+行动+观察循环研究/数据查询/Agent纯推理"Metallica 成员有几个孩子"
ToT 思维树CoT 树状扩展,多分支回溯复杂决策/战略规划简单线性推理多方案战略评估
类推提示先回想 3 个相关案例再解数学题/需要参考的推理通用对话解几何题先回想类似题
多模态图文音联合输入输出视觉理解/票据识别纯文本标记集提示法
Prompt Chain多 Prompt 串联复杂任务(写书)简单单步选题→大纲→正文→润色

重点看:"不适用"那一列。CoT 不是万能的。 简单任务加了 CoT 反而拖慢、增加 Token 消耗。

05.3 CoT:从"魔法词"到"原理"

CoT(Chain of Thought,思维链) 是 Google Research 2022 年提出的。

核心就一句话:让 AI 把推理过程写出来。

三种用法:

用法 1:Zero-Shot CoT 加一句"请一步步思考"或"Let's think step by step"。 简单粗暴。

用法 2:Few-Shot CoT 给 1-3 个完整推理示例,让 AI 模仿。 效果比 Zero-Shot 稳。

用法 3:Self-Consistency 同一个问题让 AI 回答 5-10 次(temperature 设 0.7),选出现次数最多的答案。 适用于有明确答案的数学/逻辑题。

注意:CoT 不是"魔法词"。它对简单事实问答没用,反而增加 Token。对数学/逻辑/代码调试特别有效。

05.4 ReAct:让 AI 用工具

ReAct 是普林斯顿和 Google DeepMind 2023 年提出的。 Reason + Act = 推理 + 行动。

循环结构:

Thought 1: 我需要查 Metallica 成员的妻子有几个孩子
Action 1: Search("Metallica members children")
Observation 1: Lars Ulrich has 2 children...
Thought 2: Lars 2 个 + James 3 个 + Kirk 1 个 = 6 个
Action 2: Finish(6)

适用场景:AI 需要查实时信息、操作工具、调用 API。

4 个实践建议

  1. 动作集要小而精——工具多了 AI 容易选错。
  2. 限制循环次数——5-10 轮强制输出,避免死循环。
  3. 必须定义错误兜底——搜索失败时 AI 该怎么办。
  4. 幻觉风险比 CoT 低——基于观察结果推理。

05.5 ToT:让 AI 走多步

ToT(Tree of Thoughts,思维树) = CoT 的树状扩展。 每一步不是只走一条路径,而是展开多个分支,评估后回溯。

适用场景:复杂决策、战略规划、创意探索。 不适用:简单线性推理(杀鸡用牛刀)。

python
# ToT 伪代码示意
def tree_of_thoughts(problem, max_depth=3, branch_factor=3):
    root = Node(state=problem)
    for depth in range(max_depth):
        new_nodes = []
        for node in frontier:
            branches = generate_branches(node, branch_factor)
            scored = [(b, evaluate(b)) for b in branches]
            best = sorted(scored, key=lambda x: -x[1])[:branch_factor]
            new_nodes.extend(best)
        frontier = new_nodes
    return best_node(frontier)

花叔的经验:ToT 在生产中用得不多,主要是 token 消耗大。一般只在以下情况用:

  • 决策路径不超过 5 个
  • 每个分支的评估标准可以量化
  • 任务本身容错率高(错了不致命)

05.6 多模态独家技巧:标记提示法

多模态提示是 2024 年才成熟的方向。 GPT-4o、Gemini 等模型能同时处理文本、图像、音频、视频。

我重点说一个独家技巧——标记提示法

在图片空白处打"X"标记,可消除 AI 的幻觉("无中生有"问题)。

这招对票据识别、目标计数特别有效。

更高级的是标记集提示法(Set of Mark, SoM): 用 YOLO 或 SAM 给图片中所有物体打编号,让 AI 精准识别小目标。

python
# 伪代码:在图片上标记物体
import cv2
import numpy as np

def set_of_mark(image):
    # 1. 用 SAM 分割所有物体
    masks = sam_segment(image)
    # 2. 给每个 mask 加编号
    for i, mask in enumerate(masks):
        x, y = find_center(mask)
        cv2.putText(image, str(i), (x, y), 
                    cv2.FONT_HERSHEY_SIMPLEX, 1, (255, 0, 0), 2)
    return image

Prompt:"图中有几个红色苹果?" 之前 AI 经常胡说。 用 SoM 之后,AI 直接看编号回答,准确率大幅提升。

05.7 Prompt Chain:多步拆解

最后一个最容易踩坑的模式:Prompt Chain

核心思想:把复杂任务拆成多步,每步用单独的 Prompt。

markdown
# Step 1: 选题
Prompt: "请基于'AI 编程'主题,给出 10 个公众号爆款选题"

# Step 2: 大纲
Prompt: "基于选题 #3,生成一份 3000 字文章大纲"

# Step 3: 正文
Prompt: "基于大纲,写完整正文。要求:... ..."

# Step 4: 润色
Prompt: "基于正文,润色。要求:... ..."

优势

  • 单 Prompt 超长度上限时拆分
  • 不同步骤用不同模型(便宜的 GPT-3.5 干简单活,贵的 GPT-4 干关键活)
  • 调试容易(哪步崩了改哪步)

踩坑警告

  • 多 Prompt 协同极易因某一环节质量不佳导致整体崩溃
  • AutoGPT 表现不佳的根本原因就在这
  • 目前只在 Chat、游戏等高容错场景下能较好应用
  • 任务关联度低别硬合并(如 MBTI 测试 + Midjourney 画像——应该分拆)

核心建议:单 Prompt 能搞定就别上 Chain。Chain 是"必要但有风险"的选择。

到这里你知道了 6 种推理模式的适用场景。 关键不是会用所有模式,是能在对的时候选对模式。

下一章,我们看输出控制——让 AI 给你想要格式的结果。


§06 让 AI 听你指挥:4 种输出控制技术

06.1 输出控制为什么重要

我以前最怕的不是 AI 答错,是 AI 答得"还行但没法用"。

比如让 AI 总结一篇文章。 它给了一段话,看着不错。 但我想把它存到数据库,需要 JSON 格式。 它就死活给不了。

问题出在哪?Prompt 里没说输出格式。

这章讲 4 个让 AI 听你指挥的技术。

06.2 4 种输出控制方法对比

方法原理优势局限
Function CallingAPI 内置函数描述强制 JSON 输出GPT-3.5 也能得稳定 JSON需 API 支持
Few-shot 示例提供 1-N 个输出格式样例兼容所有模型GPT-3.5 稳定性差
TypeScript 类型声明用类型定义描述格式配合注释精准约束仅 GPT-4 适用
伪代码控制用伪代码定义函数和控制流AI 对代码理解极强需要基本编程思维

重点看:第三行 TypeScript。只支持 GPT-4。 用 3.5 写 TypeScript 类型,等于没写。

06.3 Function Calling:API 帮你强制格式

Function Calling 是 OpenAI 在 2023 年推出的功能。 你在 API 里描述一个"函数"——其实就是给个 JSON Schema。 AI 回答时自动按这个 Schema 输出。

python
import openai

response = openai.chat.completions.create(
    model="gpt-4",
    messages=[{"role": "user", "content": "提取这段文本的姓名和电话"}],
    functions=[{
        "name": "extract_contact",
        "parameters": {
            "type": "object",
            "properties": {
                "name": {"type": "string"},
                "phone": {"type": "string"}
            }
        }
    }],
    function_call={"name": "extract_contact"}
)

优势:GPT-3.5 也能输出稳定 JSON(不靠 Prompt 靠 API 约束)。 局限:不是所有模型都支持(Anthropic 用 Tool Use,原理一样)。

06.4 Few-shot 示例:最通用的方法

不想用 API?用 Few-shot。 给 AI 看几个"问题-答案"的例子,它会模仿。

请按以下格式输出:

Q: 张三 30 岁,住在上海,电话 13800138000
A: {"name": "张三", "age": 30, "city": "上海", "phone": "13800138000"}

Q: 李四 25 岁,住在北京,电话 13900139000
A: {"name": "李四", "age": 25, "city": "北京", "phone": "13900139000"}

Q: 王五 28 岁,住在广州,电话 13700137000
A: ?

AI 看到两个示例后,会自动按相同格式输出第三条。

花叔的经验:3-5 个示例效果最好。示例的力量远大于规则——3-5 个好示例 > 10 条规则。

06.5 伪代码控制:包宇的实战派做法

包宇(baoyu) 是提示词圈实战派代表。 他发现一个反直觉的事实:LLM 训练过大量优质代码,对伪代码理解能力极强。

3 个实战案例:

案例 1:JSON 格式输出

typescript
// 用 TypeScript 类型定义描述输出
type ArticleSummary = {
    title: string;
    keyPoints: string[];  // 3-5 条
    conclusion: string;
};

案例 2:字幕文稿整理

python
def clean_subtitles(raw: str) -> list[Subtitle]:
    """
    1. 去除语气词(嗯、啊、那个)
    2. 合并重复句
    3. 每条字幕控制在 20 字以内
    4. 输出时间戳
    """
    ...

案例 3:一次画多张图

python
images = []
for i in range(4):
    image = generate_image(
        prompt=f"一只猫,姿势 {i}",
        style="水墨画"
    )
    images.append(image)

重点看包宇用这套方法把字幕整理的活从 40 分钟压到 3 分钟。 这就是"提示词 = 控制指令"在生产环境的威力。

06.6 4 个容错经验

输出控制经常踩坑。我总结 4 个经验:

  1. temperature 越低输出越稳定——做格式控制时建议设 0.1-0.3
  2. 出错后再降低 temperature 重试——温度降到 0 还是出错,改 Prompt
  3. JSON 出错有规律——记录日志后用 regex 预处理,比反复重试省 Token
  4. 预填充开头——API 的 assistant 消息预填 {,AI 自动补全 JSON

06.7 5 个反直觉发现

最后讲 5 个反直觉的事实:

  1. 告诉 AI 做什么,而不是不做什么(粉色大象效应)
  2. AI 足够聪明能从解释中泛化——告诉它"为什么不要省略号"(语音引擎不会发音),比直接禁止有效
  3. 指令位置很关键——长文档查询放末尾,可提升响应质量 30%(Anthropic 官方测试)
  4. 先引用再分析——让 AI 先在 <quotes> 标签中找原文引用再分析,减少幻觉
  5. 预填充开头——API assistant 消息预填 {,AI 自动补全 JSON

到这里你掌握了让 AI 输出可控结果的 4 个核心技术。

核心建议先选最简单的 Few-shot 试。 不行就上 Function Calling。只有 GPT-4 才能用 TypeScript 类型。

到这里 Part 2 完成。 你应该能:

  • 选对方法框架(8 个里选 1-2 个)
  • 用对推理模式(6 个里按场景选)
  • 控制输出格式(4 种技术里选合适的)

Part 3 我们讲实战——看官方怎么说、避坑指南、李继刚的 Lisp 之路。


Part 3: 进阶实战

从"会用"到"用好"。读者读完能识别常见陷阱,理解提示词的高级心法。

§07 看官方怎么说:谷歌 68 页和 OpenAI 6 大策略

07.1 为什么看官方

我自己写 Prompt 用了 2 年后,才意识到一件事: 官方文档比网上 90% 的教程都靠谱。

不是官方文档写得有多好,是网上太多"二手解读"加入了作者自己的偏见。 官方文档至少是模型作者自己的判断。

这章我们过两个最重要的官方文档:

  • 谷歌 68 页提示词白皮书
  • OpenAI 官方提示词指南

07.2 谷歌 68 页:CTF 黄金公式

作者:Lee Boonstra,Gemini 团队 AI 工程师,在谷歌 8 年。 2024 年写的《Prompt Engineering》白皮书。 68 页,免费可下载。

最核心的概念——CTF 黄金公式

  • C - Context(背景):指定身份、目标、受众
  • T - Task(任务):强动词 + 量化要求
  • F - Format(格式):明确返回结构

老金的金句总结:"99% 的烂回答,都是因为提示词写得像谜语。"

来看一个例子:

烂 Prompt: "写一段产品介绍"

好 Prompt(用 CTF)

[Context] 我是做 AI 编程助手的创业公司,主要客户是 30-40 岁的程序员。

[Task] 写一段 200 字的产品介绍,目标是让读者点进来看演示视频。
要求:开头用一个反常识的数据抓住注意力;中段讲一个具体的痛点场景;
结尾给一个清晰的转化路径(演示视频链接)。

[Format] 段落形式,3 段,每段不超过 80 字。

预测一下哪个效果好。

07.3 谷歌推荐的默认参数

白皮书里还有一组官方推荐的默认参数

temperature: 0.2   # 低 = 输出稳定
top_p: 0.95        # 高 = 候选词多样
top_k: 30          # 中等 = 平衡

花叔的经验:我做格式控制、结构化输出时,直接用这套默认值。微调意义不大。

07.4 粉色大象效应

白皮书里有个行为心理学经典效应的 AI 版:

"不要 X" = AI 反而更关注 X

你想让 AI 不要做什么的时候,AI 会一直想着 X。 就像你跟朋友说"别想那只粉色大象"——他脑子里立刻浮现粉色大象。

怎么改

  • ❌ "不要用专业术语"
  • ✅ "用初中生能看懂的语言"
  • ❌ "不要写得太长"
  • ✅ "控制在 200 字以内"

07.5 指令后置:对抗"迷失中间"

Anthropic 官方测试过一个发现:

长文档查询,把核心指令放在最后,响应质量提升 30%。

为什么? LLM 读长上下文时,对开头和结尾最敏感,中间容易"迷失"(Lost in the Middle)。

模板:

markdown
[很长的背景、文档、历史对话]

---

[核心指令:现在请基于以上信息,回答 XXX 问题]

07.6 OpenAI 6 大策略

OpenAI 官方提示词指南总结的 6 条核心策略:

  1. 写清晰说明

    • 包含具体细节
    • 采用角色
    • 用分隔符区分不同部分(---""")
    • 指定步骤
    • 提供示例
    • 指定长度
  2. 提供参考文本

    • 让 AI 引用而非凭空编造
    • 减少幻觉
  3. 拆分复杂任务

    • 意图分类(先分类再处理)
    • 对话摘要(长对话定期总结)
    • 递归总结长文档
  4. 给模型时间思考

    • 让 AI 自己找解决方案(不直接给答案)
    • 内心独白隐藏推理过程
    • 询问是否遗漏
  5. 使用外部工具

    • 嵌入搜索(RAG)
    • 代码执行
    • 函数调用
  6. 系统测试变化

    • 用黄金标准答案评估
    • 避免局部最优
    • "如果可以测量,则提高性能会更容易"

重点看:第 4 条"给模型时间思考"。很多新手怕 AI 慢,直接要结果。 但实际上你让 AI 多想 5 秒,能省你 5 分钟调 Prompt。

07.7 评估方法 6 种

OpenAI 官方给了 6 种评估方法:

方法成本速度适用
外包人工注释关键任务
内部人工审核内部使用
基于模型的评估越来越有效
基于代码的评估明确规则
准确度指标分类/翻译
终端用户反馈与 A/B 测试持续最重要

花叔的经验前面 5 种都是手段,最后 1 种才是目的。 用户不喜欢的回答,再"正确"也没用。

到这里你应该把官方文档的精华吃透了。 CTF 公式 + OpenAI 6 大策略 = 写提示词的"宪法"。

下一章,我们看反模式——什么 Prompt 是绝对不能写的。


§08 别踩这些坑:15 个反模式避坑指南

08.1 为什么反模式比方法论更重要

我学提示词走过最长的弯路,就是只学方法不学反模式。 结果就是:学了 100 个框架,遇到具体问题还是不会写。

反面案例比正面案例更有教育意义。 看到一个烂 Prompt,你知道错在哪;看到一个好 Prompt,你可能不知道为什么好。

这章讲 15 个最常见的反模式。 每个都给你"错在哪"+"怎么改"。

08.2 6 大反模式(按出现频率)

反模式 1:过度指令 (Instruction Overload)

  • 错在哪:指令堆砌导致"指令疲劳",AI 权重稀释
  • 怎么改:优先级放前面,每条说明原因,合并同类项
markdown
# ❌ 烂 Prompt
你是一个专家,输出要详细、要有深度、要通俗易懂、要分点、
要有案例、要使用专业术语但又不要太难、要先说结论再说原因、
要使用 markdown 格式、要在 1000 字左右、要...

# ✅ 好 Prompt
你是资深产品经理。
回答分 3 段:结论(1 句)、分析(200 字)、建议(100 字)。

反模式 2:模糊上下文 (Vague Context)

  • 错在哪:"分析这个数据"——AI 只能猜测字段、单位、口径
  • 怎么改:明确数据格式、字段定义、单位
markdown
# ❌ 烂 Prompt
分析这个销售数据

# ✅ 好 Prompt
这是 2024 年 Q1 公司销售数据(CSV 格式,字段:日期/产品/数量/单价/客户)。
请找出销量 Top 3 的产品和对应的客户群体,给出 1 句话总结。

反模式 3:缺少输出格式约束

  • 错在哪:输出可能是话、逗号、Markdown,无法后续处理
  • 怎么改:明确指定 JSON Schema 等格式

反模式 4:角色设定空洞化

  • 错在哪:"你是经验丰富的工程师"——无法提取行为约束
  • 怎么改:具体化背景、专长、行为习惯
markdown
# ❌ 烂 Prompt
你是经验丰富的 Python 工程师

# ✅ 好 Prompt
你是某大厂工作 8 年的 Python 后端工程师。专长是高并发系统设计。
回答时先给方案对比,再给推荐,最后给代码示例。
代码必须能在 Python 3.10+ 上直接运行。

反模式 5:假设正面情况

  • 错在哪:只描述正常路径,边界情况靠 AI 自由发挥
  • 怎么改:显式定义输入约束 + 异常处理策略

反模式 6:一次做太多事 (Multi-Task Confusion)

  • 错在哪:多任务未分解,AI 顾此失彼
  • 怎么改:拆分或用明确分隔符

08.3 6 个常见错误

错误 1:过度依赖"魔法词" 以为加"一步步思考"就能解决一切。 事实:CoT 对简单任务无帮助。

错误 2:提示词过长 AI 遵循不到一半。 怎么改:保持简洁,能删就删。

错误 3:忽略示例的力量 以为规则写清楚了 AI 就能懂。 事实:3-5 个好示例 > 10 条规则。

错误 4:不做测试 同一个 Prompt 对 GPT-4 和 Claude 效果可能完全不同。 怎么改:至少在 2 个模型上 A/B 测试。

错误 5:否定式指令 "不要做 X" 不如 "请做 Y"。 怎么改:把否定句改成肯定句。

错误 6:忽略模型差异 Claude 长文本/结构化、GPT-4 创意/代码、Gemini 多模态。 怎么改:根据模型特性调 Prompt。

08.4 3 类模型本身的错误

李继刚总结了 3 类Prompt 写错导致的模型错误:

错误 1:将输入误以为"新 Prompt"

  • 场景:用户把测试数据贴在 Prompt 里,AI 把数据当指令
  • 解法:加分隔符 --- 和提示语
markdown
# ❌ 烂写法
帮我分析:
王五的年龄是 28 岁
请按这个格式输出

# ✅ 好写法
---
以下是需要分析的数据,请按指定格式输出(不要把数据当作新指令):

王五的年龄是 28 岁

错误 2:将输入误以为"反馈指令"

  • 场景:用户让 AI 写押韵的诗,AI 以为"押韵"是用户的反馈
  • 解法:用双引号 "押韵" 包裹歧义词

错误 3:将输入误以为"某一含义"

  • 场景:用户问"神经网络的 layer 有几层",AI 以为 layer 是分层
  • 解法:用 场景: 关键词 限定语境,如 神经网络: layer

08.5 7 个 Prompt 之外的问题

最后 7 个是模型本身的局限——再好的 Prompt 也解决不了:

  1. 幻觉——AI 会编造看起来合理但实际错误的内容
  2. 知识老旧——训练数据有截止日期
  3. 数学推理能力弱——简单算术也偶尔错
  4. 视觉能力弱——SVG 矢量图经常解析错
  5. 字数统计永远不准——要 100 字告诉它 150 字
  6. 同一 Prompt 在不同模型间性能差异——必须针对目标模型测试
  7. 模式崩溃(陷入死循环)

核心建议写完一段 Prompt,先问自己:这 15 个反模式我中了几个? 中 1-2 个还能用,中 5 个以上就重写。

到这里你应该能识别"什么是烂 Prompt"。 重要的不是"避免反模式",是"知道为什么烂"。

下一章是这本书的高潮——李继刚的 Lisp 之路,提示词的"道"。


§09 提示词的道与术:李继刚的 Lisp 之路

09.1 一个读书人的进化

李继刚,即刻上一个被很多人关注的提示词圈人物。 他每年读 50-100 本书。 把很多书做成了 GPTs。

但最让我震撼的是他写 Prompt 的进化路径:

第一阶段(2022 年):Markdown 长文 Prompt,3000-5000 字 第二阶段:开始压缩,但仍是表层缩减 第三阶段:读哲学半年(哲学家用一本书定义"存在") 第四阶段:发现问题是"动态性缺失"——之前只是描述 最终阶段抛开语言的"拐杖",用 5-6 个核心词直指原子核

从 5000 字到 5 个词。 这是怎么做到的?

09.2 三个核心要素

李继刚自己说,写好 Prompt 必须三个要素结合:

  1. 理解 LLM——《这就是 ChatGPT》(Stephen Wolfram 著),他读过 3 遍以上
  2. 行业 KnowHow——隐性知识,难以 token 化的那部分才是壁垒
  3. 逻辑清晰 + 表达力——不矛盾、不前后不一致

核心洞察写好 Prompt 是结果,不是原因。 你读了多少书、想了多少事、表达得多清楚,决定了你的 Prompt 上限。

09.3 提示词 = 表达

李继刚最被引用的一句话:

"提示词的本质就是表达。"

展开说:

  • 表达三要素:本意(脑海里的想法)+ 文意(选词)+ 解意(对方理解)
  • 本意取决于:经验 + 词汇映射 + 原理理解
  • 真正决定 Prompt 质量的是"本意"

这就是为什么很多人写 Prompt 写得烂——不是他写不好,是他自己没想清楚要什么。

09.4 乔哈里视窗:4 个象限装下所有技巧

李继刚用了一个经典心理学模型——乔哈里视窗——把所有 Prompt 技巧归类:

AI 知道AI 不知道
人知道简单说就行(第一象限)喂模式(举例/RAG/定义字典)(第四象限)
人不知道提问题(第二象限)开放聊(第三象限)

重点看:第一象限和第四象限。80-90% 的日常 Prompt 任务在这两个象限。

反直觉发现:网上很多人说"指定角色失效"——对第一象限确实失效(AI 已经知道的事,再指定角色没用)。 但对第四象限(AI 不知道的领域),指定角色仍然非常有效。

为什么? 因为指定角色 = 给 AI 一个"思考框架"。 在 AI 不知道的领域,框架能帮它定向收敛

09.5 黑色屋子里的星图:Lisp 提示词的画面感

李继刚讲他怎么想到 Lisp 风格的 Prompt 时,用了一个画面:

"我看见一间黑色屋子,星星全是黑的。我喊星星的名字就能点亮它,按顺序叫出 4-5 颗星星,依次点亮、连成一条脉络线——这条脉络线对模型来说就是一个 pattern,所有输出都基于这个 pattern 泛化。"

灵感来源:

  • 《为什么伟大不能被计划》黑色空间的描述
  • 《这就是 ChatGPT》Wolfram 的向量空间插图

来看一个 Lisp 风格的 Prompt 例子:

lisp
;; 性格内核
(内核 警觉 好奇 谨慎)
;; 思考方式
(模式 假设-验证-迭代)
;; 表达约束
(语言 短句 动词-名词)

重点看这不是在"描述",是在"点亮星星"。 你给的不是"AI 应该如何如何"的描述,而是"AI 应该在哪个 pattern 上工作"的锚点。

09.6 提示词工程师 = 人文 × 技术

李继刚还有一个让我很认同的观点:

"提示词工程师"本身就暗示了两者的交集。

  • 程序员视角的局限:以为 Prompt = 用自然语言编程(其实是写作)
  • 内容创作者视角的局限:以为只是写作(但需要结构化思维)

两条培养路径:

  • 从技术向人文:找爱写博客、善表达的程序员
  • 从人文向技术:找有计算机背景、逻辑清晰的作家/PM

我自己就是"从技术向人文"那条路径。 写了 10 年代码,最近 3 年才开始系统写公众号、读哲学书。 回过头看,写 Prompt 能力的提升,跟我表达能力提升是同步的。

09.7 Read in, Prompt out

李继刚的金句:

"真正的较量早已在大脑中完成。要写好 Prompt 先要多读书。质量欠佳的 Prompt 出自赶工没输入的日子;4-5 个词的精准 Prompt 背后是一整天的阅读。"

Read in, Prompt out。

这是这本书最重要的一个心法。

你读了什么,决定了你能写什么。 你思考了什么,决定了你能让 AI 输出什么。

Prompt 不是咒语,Prompt 是你大脑的外化。 你的大脑有多清楚,Prompt 就有多清楚。

09.8 LLM 进步 vs 人能退到哪

李继刚画了一张图:

  • X 轴(AI 知道边界) 正在快速向下
  • Y 轴(人知道边界) 我们能向左推进吗?

AI 越来越强,能做的事越来越多。 人呢? 我们能向"AI 不知道的领域"推进吗?

李继刚的回答逻辑(演绎+归纳)+ 审美 是留给人的最后底线。 隐性知识、行业 KnowHow、表达力——这些是 LLM 短期内补不上的。

你不需要跟 AI 比赛逻辑、比赛事实记忆。 你需要在 AI 不知道的领域,找到自己独特的 KnowHow。 然后用 Prompt 让 AI 帮你放大这个 KnowHow。

到这里你应该理解**"道"**:

  • 提示词不是咒语,是表达
  • 表达质量取决于你的输入(阅读、思考、KnowHow)
  • 高手用 5 个词就能让 AI 输出高质量结果
  • 隐性知识 + 表达力 = 你跟 AI 的差异化壁垒

下一章是全书最后一章——未来 3 年提示词的演化方向。


§10 未来 3 年:提示词的演化方向

10.1 三个明确趋势

我在这个领域 3 年,见过太多"AI 已经要取代 XX 了"的标题。 但我看到的真相是:提示词工程是过去 3 年少数"越来越重要"的技能。

未来 3 年,有 3 个趋势是明确的:

趋势 1:从"写 Prompt"到"设计 Prompt 系统" 单条 Prompt 时代已经过去了。 未来是 Prompt 系统的时代——多个 Prompt 协同,配套 RAG、微调、评估。 单点能力会被自动化,系统设计能力才是壁垒。

趋势 2:从"自然语言"到"多模态" 2024 年 GPT-4o、Gemini 多模态大爆发。 提示词从"纯文本"扩展到"文本+图像+音频+视频"。 未来 3 年,多模态提示词会是新增量最大的领域。

趋势 3:从"通用 Prompt"到"个性化 Prompt" 同一个 Prompt 对不同人效果不同。 未来会出现"个性化提示词"——根据你的使用习惯、行业、风格,自动调优。 这背后是用户画像 + RLHF 的结合。

10.2 三个模糊判断

但有些事我不确定:

判断 1:AI 会不会"自动写 Prompt"? 会。 LangGPT 自动生成的 Prompt 节省 60% 编写时间。 未来 3 年,AI 帮你写 Prompt 会成为标配。 但"判断 Prompt 写得好不好"仍然是人的事。 就像虽然有了 IDE,程序员的判断力还是不可替代。

判断 2:提示词工程师会不会被取代? 不会被取代。 但会分化。 基础提示词工程师(写模板、调格式)会被自动化工具取代。 高级提示词工程师(懂业务、懂 LLM、懂用户)会更值钱。

判断 3:开源模型会不会改变格局? 会。 开源模型越来越强,提示词的"模型适配"会更重要。 同一个 Prompt 在 GPT-4 和 Llama 3 上可能效果完全不同。 懂多模型的人会有溢价。

10.3 一个清醒的认知

最后说一句清醒的认知

Prompt 工程师的护城河,不是"知道多少技巧",是"理解多深的业务"。

我见过太多人收藏了几百个 Prompt 模板,但写不出好的 Prompt。 也见过不懂技术的产品经理,写出来的 Prompt 让 AI 输出惊艳。

差别在哪? 在"本意"。

你有没有想清楚要什么。 你有没有真的懂你的业务。 你有没有足够的词汇和逻辑把它表达出来。

这三个问题不解决,给你再多框架也没用。

10.4 写给你的最后一段话

如果你读到这里,谢谢。

这本书不长,但你读完了。 我希望它至少做到了三件事:

  • 让你不再把提示词当玄学
  • 让你知道什么 Prompt 烂、为什么烂
  • 让你开始思考"我想让 AI 做什么",而不是"AI 能做什么"

最后送你李继刚的那句话:

"真正的较量早已在大脑中完成。"

从今天开始,多读、多想、多写。 Read in, Prompt out。

AI 时代最稀缺的,不是会用 AI 的人。 是知道自己想要什么、并且能说清楚的人

希望你是。


附录 A 阅读指南

时间章节目标
Day 1§01-§03从零到第一次跑通
Day 2-3§04-§06掌握核心能力
Day 4-5§07-§09进阶实战
Day 6§10趋势预判

如果只有 2 小时:§01 + §04 + §08 + §09。 如果只有 30 分钟:§01。


附录 B 资源速查

B1 必读官方文档

B2 必读论文

论文年份核心贡献
Chain of Thought2022思维链推理
ReAct2023推理+行动结合
Tree of Thoughts2023思维树搜索
The Prompt Report2024涵盖 58 种 LLM 提示技术,最全综述

B3 主流提示词库

  • 通用:Anthropic Prompt Library、FlowGPT、Prompt Engineering Guide
  • 编程:Cursor Rules、Claude Code Rules
  • 聚合:PromptBase(付费)、Krea(创意类)

B4 必读书籍

  • 《这就是 ChatGPT》(Stephen Wolfram)— 理解 LLM 原理必读
  • 《关于说话的一切》— 表达学经典
  • 《为什么伟大不能被计划》— 李继刚 Lisp 提示词灵感来源

B5 关键人物

  • 云中江树(刘远忠):LangGPT 作者,结构化提示词先驱
  • 李继刚:提示词圈最具哲学深度的实战派
  • 包宇(baoyu):伪代码控制 LLM 输出的开创者
  • Lee Boonstra:谷歌 Gemini 团队,68 页白皮书作者
  • 老金:把谷歌 68 页扒成 5 任务元提示词的实践者

附录 C 5 任务元提示词(老金整理)

基于谷歌 68 页白皮书浓缩的 5 步元提示词:

任务 1:搭地基

基于用户需求,定义 AI 的角色、目标、约束。

任务 2:选策略

选择适合的推理模式(CoT、ReAct、ToT 等)。

任务 3:让 AI 听话

定义输出格式、长度、风格。

任务 4:玩高级

加 Few-shot、加 Chain、加多模态。

任务 5:迭代优化

跑测试、看输出、调 Prompt。


花叔出品 | AI Native Coder · 独立开发者 公众号「花叔」| B站「AI进化论-花生」 代表作:Claude Code从入门到精通 · OpenClaw橙皮书 · Hermes Agent从入门到精通

Last updated:

Released under the MIT License.