提示词的道与术 · 13 份资料综合梳理

FH · 26.06.05 · 01 / 22

THE WAY & THE CRAFT · FIELD NOTE

提示词
是表达。

13 份资料 · 6000 行原文 · 5 个主题簇 · 30 分钟。
从一个反直觉论断出发,走到一条可抄走的 5 任务清单。

代讲者 · 行业内部私享会 · 2026.06

→ swipe / arrow keys

Field Note · Distilled

02 / 22

13 份 / 6000 行 / 1 句话

蒸馏之后,
这句话最重。

提示词的本质,
不是写句子,是表达。

13 份资料

6,000^行

原作者

7 位

核心方法

9 簇

私享会时长

30^min

— 李继刚《提示词的道和术》L15 · 2024 AI 创新者大会

Context · What I See

03 / 22

BEFORE & AFTER · 99% 的人困在这里

烂的提示词
和好的提示词,

BEFORE

"总结一下这篇文章。"

没说读者、没说目的、没说格式。AI 只能猜,猜错就被骂"AI 真笨"。

AFTER

"我是产品经理,要给 CEO 写一页决策摘要。
读者只关心 3 件事:成本/风险/退出条件。"

CTF 公式 — Context 身份受众 + Task 强动词 + Format 输出形态。差距是数量级的。

Context · The Numbers

04 / 22

FIVE NUMBERS · 5 个数据点决定你的"用 AI 姿势"

把数据摆出来,
别只讲故事。

"烂回答" 来自谜语式提问99%

第一+第四象限覆盖日常场景80–90%

元提示词节省的编写时间60%

GPT-3.5 在小任务上达 GPT-4 性能80%

多模态模型标记前可识别物品数9 类

出处:13 份资料的实证与原文引用 · 详见末页附录

Context · The Stack

05 / 22

PRIORITY

决定效果
的三层因素

提示词排第三,但它是唯一你手里能拧的螺丝。

— 李继刚

01

模型

GPT-4 > Claude > GPT-3.5。模型能力是天花板,选错模型,提示词写得再漂亮也补不上。

02

任务

任务拆得对,提示词就短一半。"任务拆解的停止条件是:模型表现够好即可。"

03

提示词

排第三,但因为是你唯一能直接操控的,所以获得过多关注——也最值得研究。

Section 壹

06 / 22

ACT I · 表达的工程

提示词不是一句话。

它是你脑海里的"本意",被文字压缩后,再被 AI 还原的过程。
这个过程里三层偏差,每一层都能让你的提示词变垃圾。

Core 1 · 表达三要素

07 / 22

EXPRESSION DECOMPOSITION

提示词差在哪?
三层偏差。

戴明环的视角:把模糊的本意变成确定的输出,中间要过两关。

— 01 / 本意

脑海里
的意图

混沌、模糊、带着上下文。99% 的人卡在第一关——自己也没想清楚。

— 02 / 文意

落到
纸面上

压缩、丢失、变形。"要一个好看"——什么叫好看?给 AI 的信息比给设计师的还少。

— 03 / 解意

AI 还原
回本意

模型在猜。它猜得对不对,完全看你给了多少"消除歧义的锚点"。

— 04 / 戴明环

PDCA:
写 → 跑 → 改

提示词写完不是结束,是开始。至少跑 3 轮再下结论。

Core 2 · Johari Window

08 / 22

选错象限,
写得再长
也白搭

80%–90% 的日常 Prompt 任务落在第一+第四象限——人知道 + AI 也知道 / 人知道 + AI 不知道。剩下 10%–20% 是"我都不知道我想要什么"的开放式探索。

Q1 开放

50%

人知道 · AI 知道

Q2 盲区

10–20%

人不知道 · AI 知道

Q4 求知

30–40%

人知道 · AI 不知道

Section 贰

09 / 22

ACT II · 模板与编程

写 Prompt 像写文章。

不要把它当一句话——把它当一个文章结构:
角色 / 背景 / 目标 / 约束 / 工作流 / 初始化。# 号分层,属性词归类,语义块独立。

Core 3 · LangGPT Role

10 / 22

STRUCTURED PROMPT · 像写文章

5 个模块
就够了

LangGPT 的最小可用结构。
# 标识层级,属性词归纳语义。

— 云中江树《结构化系统论述》

# Role: 你的角色名

## Profile
- author / version / language
- description: 一句话定义

## Skills
### Skill-1
1. 技能描述
### Skill-2
1. 技能描述

## Rules
1. Don't break character.
2. Don't make up facts.

## Workflow
1. First, ...
2. Then, ...
3. Finally, ...

## Initialization
As a/an <Role>, you must...

Core 3 · Six Writing Axes

11 / 22

CTF 黄金公式 · 写之前先对齐 6 个维度

Context × Task × Format

01

身份

你让 AI 扮演谁?专家、助理、评审官?

02

受众

写给谁看?CEO / 工程师 / 小白?

03

目标

最终交付什么?决策 / 学习 / 执行?

04

强动词

总结 ≠ 决策摘要 ≠ 关键风险清单。动词决定 AI 走哪条路。

05

格式

Markdown 表格 / JSON / 列表?指定越细,越不用解释。

06

量化

要 3 段、5 句、200 字。模型字数永远不准,给余量。

Core 3 · Pseudo-code

12 / 22

WHEN NATURAL LANGUAGE FAILS

当自然语言
力不从心——
写伪代码。

LLM 训练时读过海量优质代码,def/if/for/TypeScript 类型,模型秒懂。多分支、多子任务、字段定义——把它们写出来,比写十段说明管用。

Section 叁

13 / 22

ACT III · 协同与飞轮

单 Prompt 必崩。

复杂任务 = 链 / 树 / 图 · 不同模型混部 · RAG + 微调是飞轮,不是替代。

Core 4 · Prompt Chain

14 / 22

CHAIN-OF-PROMPTS · 5 步流水线 + ReAct 案例

把任务拆开
让 AI 接力。

STEP 01搜集者信息检索

STEP 02分析师数据处理

STEP 03作家内容生成

STEP 04评审官质量校验

STEP 05发布者格式化输出

REACT 案例 · 来自老金《谷歌白皮书》

思考 → 行动 → 观察 → 思考 → 行动 ··· 直到凑齐信息。
"Metallica 4 个成员,James 3 个、Lars 2 个、Kirk 0 个、Robert 3 个 → 8 个孩子"

停止条件:
模型表现够好即可

Core 4 · Stability Formula

15 / 22

EVALUATION · 两个必须会算的指标

不跑 N 次,
不知道
提示词好不好。

— 云中江树《提示链》L725

S

STABILITY · 稳定度

数量最多的类别 / 总运行次数

= S%

U

USABILITY · 可用性

可用结果数 / 总运行次数

= U%

N

SAMPLE SIZE · 最小样本

建议 ≥ 10 次,2-3 个 prompt 对比

≥ 10

★

实战经验

S > 80% 才敢上线 · U > 95% 算稳定

目标

Core 5 · RAG vs Fine-tune

16 / 22

DECISION TREE · 选错 = 烧钱

RAG vs 微调

RAG · 开卷考试

谁带的书全,
谁翻得快,
谁就赢。

补知识。适合专才,不适合通才。成本可控,几周到几月上线。

成本:低 · 周期:短

FINE-TUNE · 全职培训

炼风格、塑人格,
把模型从"聪明"
改造成"像你"。

补风格。烧钱——至少几个亿 + 高质量行业数据,没有就慎重。

成本:数亿 · 周期:半年+

推荐路径:Prompt → Few-shot → 简单 RAG → 微调 → 进阶 RAG → RAG+微调 — 提示工程贯穿始终。

Core 5 · Meta Prompt · 5 Tasks

17 / 22

META-PROMPT · 老金 5 任务清单 v1.0

写提示词
的提示词。

下次写 Prompt 前对照这 5 件事检查。
自动化生成能省 60% 时间。

T01

构建提示词地基

CTF 公式 · System/User 分离 · 肯定性指令(粉色大象效应)

T02

激活深度推理

Zero-Shot / Few-Shot / CoT / ToT / Step-Back · 强制自我修正

T03

掌控回答与行为

Schema / Prefilling · Temperature 0.0-0.2 严谨 / 0.7-1.0 创意

T04

架构自动化工作流

拒绝超级提示词 · 提示词链 · PM/架构师/测试/开发多智能体

T05

持续优化与维护

Git 版本管理 · A/B 测试 2-3 提示词 × 10 次 · 提示词库

Core 5 · Counter-intuitive

18 / 22

SIX COUNTER-INTUITIVES · 6 条反直觉

读了 13 份之后,
最反直觉的 6 条

粉色大象

说"不要做 X",AI 反而关注 X。
用"请做 Y"代替。

迷失中间

长文档中间部分被忽略。
核心指令放最后面。

深呼吸法

只在 PaLM 有效。
GPT 上面表现一般。

结构化 ≠ 创意

结构化提示词对创意性要求高的场景
不适用,反证其能"降低不确定性"。

字数不准

模型永远数不准 token。
要 100 字?告诉它写 150。

先写长,再写短

结构化是方法论封装,
也会成为枷锁。

这些不是技术缺陷,是模型的工作方式。理解它,就能绕开它。

Section 肆

19 / 22

ACT IV · 减法的胜利

写得越短, 效果越好。

李继刚从 3000 字 markdown 走到 5 词 lisp。
这不是减法,是穿透。

Shift · 减法

20 / 22

THE TURN · 转折点

两个 Prompt 的距离

2023 · MARKDOWN

# Role: 公文笔杆子 ## Profile - author: Arthur - version: 0.3 - language: 中文 - description: 我是一位政府机关的材料写作者,专注于公文写作 ## Background 我是一位在政府机关工作多年的公文笔杆子…… ## Goals - 根据用户输入的关键词,思考对应的公文场景,展开写作 - 输出一篇完整的公文材料,符合规范和标准 ## Constrains: 1. 对于不在你知识库中的信息,明确告知用户你不知道 2. 你可以调用数据库或知识库中关于公文语料的内容 3. 你可以较多地使用来自域名 ".gov.cn" 的语料内容 ## Skills: 1. 具有强大的文章撰写能力 2. 熟悉各类公文的写作格式和框架 3. 对政府机关的工作流程有深入了解 4. 拥有排版审美,会利用序号,缩进,分隔线和换行符 …

3000 字 · 注意力飘移 · 质量不稳

2024 · LISP

(define 角色
  (技能 . 写作)
  (语气 . 沉稳)
  (视角 . 民众))
  (输出 . 一段话))

5-6 个核心词直指原子核

语言表达在被 ChatGPT 压缩 · 元能力是"穿透"

Takeaway · 3 句话

21 / 22

TAKEAWAY · 3 句话

今晚带走的
三句话。

01 · 表达

提示词是表达,不是沟通。
本意比文意更重要。

02 · 三件事

写好 = 理解 LLM + 行业 Know-how + 逻辑不矛盾。

03 · 飞轮

提示工程贯穿始终,提示链 + RAG + 微调是飞轮,不是替代。

22 / 22

CLOSING

MANIFESTO

写好
一个提示词。
用好一辈子。

— 从 13 份资料出发,到一张 22 页的现场指南。提示词是表达,不是沟通;是工程,不是玄学。

[选填] 作者 · 头衔

YY.MM.DD

TAKEAWAYS

03 RULES

01

表达 > 沟通

99% 的烂答案不是 AI 的错,是人类"用谜语当需求"。把脑海里的"本意"翻译成 AI 的"解意",提示词就是桥梁。

02

写好 = 三件事

理解 LLM · 行业 Know-how · 逻辑不矛盾。先把本行业的"隐知识"挖出来,再翻译给 AI。— 李继刚

03

提示工程贯穿始终

RAG / 微调 / Agent 都不是提示词的替代,而是它的延伸。提示工程是地基,也是飞轮的第一圈。

→ 完 · 13 份 / 6000 行 / 1 句

提示词是表达。

蒸馏之后,这句话最重。

烂的提示词和好的提示词,

"总结一下这篇文章。"

"我是产品经理,要给 CEO 写一页决策摘要。读者只关心 3 件事:成本/风险/退出条件。"

把数据摆出来,别只讲故事。

决定效果的三层因素

模型

任务

提示词

提示词 不 是一句话。

提示词 差 在哪?三层偏差。

脑海里的意图

落到纸面上

AI 还原回本意

PDCA:写 → 跑 → 改