模型
GPT-4 > Claude > GPT-3.5。模型能力是天花板,选错模型,提示词写得再漂亮也补不上。
提示词的本质,
不是写句子,是表达。
没说读者、没说目的、没说格式。AI 只能猜,猜错就被骂"AI 真笨"。
CTF 公式 — Context 身份受众 + Task 强动词 + Format 输出形态。差距是数量级的。
出处:13 份资料的实证与原文引用 · 详见末页附录
提示词排第三,但它是唯一你手里能拧的螺丝。
GPT-4 > Claude > GPT-3.5。模型能力是天花板,选错模型,提示词写得再漂亮也补不上。
任务拆得对,提示词就短一半。"任务拆解的停止条件是:模型表现够好即可。"
排第三,但因为是你唯一能直接操控的,所以获得过多关注——也最值得研究。
它是你脑海里的"本意",被文字压缩后,再被 AI 还原的过程。
这个过程里三层偏差,每一层都能让你的提示词变垃圾。
戴明环的视角:把模糊的本意变成确定的输出,中间要过两关。
混沌、模糊、带着上下文。99% 的人卡在第一关——自己也没想清楚。
压缩、丢失、变形。"要一个好看"——什么叫好看?给 AI 的信息比给设计师的还少。
模型在猜。它猜得对不对,完全看你给了多少"消除歧义的锚点"。
提示词写完不是结束,是开始。至少跑 3 轮再下结论。
人知道 · AI 知道
人不知道 · AI 知道
人知道 · AI 不知道
不要把它当一句话——把它当一个文章结构:
角色 / 背景 / 目标 / 约束 / 工作流 / 初始化。# 号分层,属性词归类,语义块独立。
LangGPT 的最小可用结构。
# 标识层级,属性词归纳语义。
# Role: 你的角色名 ## Profile - author / version / language - description: 一句话定义 ## Skills ### Skill-1 1. 技能描述 ### Skill-2 1. 技能描述 ## Rules 1. Don't break character. 2. Don't make up facts. ## Workflow 1. First, ... 2. Then, ... 3. Finally, ... ## Initialization As a/an <Role>, you must...
你让 AI 扮演谁?专家、助理、评审官?
写给谁看?CEO / 工程师 / 小白?
最终交付什么?决策 / 学习 / 执行?
总结 ≠ 决策摘要 ≠ 关键风险清单。动词决定 AI 走哪条路。
Markdown 表格 / JSON / 列表?指定越细,越不用解释。
要 3 段、5 句、200 字。模型字数永远不准,给余量。
LLM 训练时读过海量优质代码,def/if/for/TypeScript 类型,模型秒懂。多分支、多子任务、字段定义——把它们写出来,比写十段说明管用。
TypeScript 类型 + 简单函数骨架 = 最稳的 JSON/Schema 输出控制。GPT-3.5 也能用。
复杂任务 = 链 / 树 / 图 · 不同模型混部 · RAG + 微调是飞轮,不是替代。
思考 → 行动 → 观察 → 思考 → 行动 ··· 直到凑齐信息。
"Metallica 4 个成员,James 3 个、Lars 2 个、Kirk 0 个、Robert 3 个 → 8 个孩子"
— 云中江树《提示链》L725
数量最多的类别 / 总运行次数
可用结果数 / 总运行次数
建议 ≥ 10 次,2-3 个 prompt 对比
S > 80% 才敢上线 · U > 95% 算稳定
补知识。适合专才,不适合通才。成本可控,几周到几月上线。
补风格。烧钱——至少几个亿 + 高质量行业数据,没有就慎重。
推荐路径:Prompt → Few-shot → 简单 RAG → 微调 → 进阶 RAG → RAG+微调 — 提示工程贯穿始终。
下次写 Prompt 前对照这 5 件事检查。
自动化生成能省 60% 时间。
CTF 公式 · System/User 分离 · 肯定性指令(粉色大象效应)
Zero-Shot / Few-Shot / CoT / ToT / Step-Back · 强制自我修正
Schema / Prefilling · Temperature 0.0-0.2 严谨 / 0.7-1.0 创意
拒绝超级提示词 · 提示词链 · PM/架构师/测试/开发多智能体
Git 版本管理 · A/B 测试 2-3 提示词 × 10 次 · 提示词库
说"不要做 X",AI 反而关注 X。
用"请做 Y"代替。
长文档中间部分被忽略。
核心指令放最后面。
只在 PaLM 有效。
GPT 上面表现一般。
结构化提示词对创意性要求高的场景
不适用,反证其能"降低不确定性"。
模型永远数不准 token。
要 100 字?告诉它写 150。
结构化是方法论封装,
也会成为枷锁。
这些不是技术缺陷,是模型的工作方式。理解它,就能绕开它。
李继刚从 3000 字 markdown 走到 5 词 lisp。
这不是减法,是穿透。
5-6 个核心词直指原子核
提示词是表达,不是沟通。
本意比文意更重要。
写好 = 理解 LLM + 行业 Know-how + 逻辑不矛盾。
提示工程贯穿始终,提示链 + RAG + 微调是飞轮,不是替代。
① 抄走老金 5 任务清单 · ② 用 LangGPT 重写你的系统提示词 · ③ 把"不要 X"改写为"请 Y"
99% 的烂答案不是 AI 的错,是人类"用谜语当需求"。把脑海里的"本意"翻译成 AI 的"解意",提示词就是桥梁。
理解 LLM · 行业 Know-how · 逻辑不矛盾。先把本行业的"隐知识"挖出来,再翻译给 AI。— 李继刚
RAG / 微调 / Agent 都不是提示词的替代,而是它的延伸。提示工程是地基,也是飞轮的第一圈。