提示词工程：定义与含义 — AI 维基

通过精心设计输入以获得更好的AI模型输出的实践。这包括从简单技巧（明确具体、提供示例）到高级方法（思维链、少量示例提示、角色分配）的范围。尽管名称听起来很花哨，但本质上是与统计系统进行清晰沟通的问题。

为什么重要

相同的模型根据提问方式不同可能会产生截然不同的结果。优秀的提示工程是提升AI输出质量最经济的方式——无需训练，无需微调，只需更有效的沟通。

深度解析

提示工程常被轻视为“只是礼貌地提问”，但实际上，对于使用AI API的任何人来说，它是杠杆效应最高的技能。核心洞察是语言模型对请求的表述方式极其敏感。模糊的提示（“写一些处理数据的代码”）会激活大量可能的响应分布。而具体的提示（“编写一个Python函数，读取CSV文件，筛选出'status'列等于'active'的行，并返回一个字典列表”）则将该分布压缩到更狭窄、更有用的范围内。一个懒散的提示与一个精心设计的提示在输出质量上的差异，往往比两个模型生成结果之间的差异更大。

技术叠加

这些技术可以叠加使用。在基础层，你需要清晰和具体——明确告诉模型你想要什么、以什么格式、什么约束条件。叠加角色分配（“你是一位资深的PostgreSQL数据库管理员，正在审查这个查询的性能问题”），你就能将模型的输出分布引导至专家级响应。添加少量示例，你就能定义期望的格式和风格。加入思维链指令，你就能提升推理质量。指定输出结构（“以包含summary、severity、recommendation键的JSON格式回复”），你就能获得可被机器解析的结果。每项技术本身都很简单，但将它们组合得当才是真正的技能所在。

真正的生产环境提示工程与演示完全不同。在一个生产系统中，你的提示是一个经过仔细版本控制的模板，带有变量，经过一套评估案例的测试，并像代码一样不断迭代。Anthropic和OpenAI等公司发布的提示工程指南，更像是软件文档而非创意写作建议。一个典型的生产环境提示，比如客户支持分类器，可能包含500–2000个token的指令、示例、边缘情况处理和输出格式规则。团队会进行A/B测试不同提示版本，跟踪准确率和用户满意度等指标，并像维护代码库一样维护提示库。

有效模式

一些在各模型中都持续有效的实用模式：通过“如果你不确定，请说明”给模型一个“退出”选项（减少幻觉）。使用XML标签或三重反引号等分隔符，明确区分指令和数据（防止提示注入）。将最重要的指令放在提示的开头和结尾，而非中间（与注意力机制的运作方式一致）。明确说明你不要什么（“不要在回复中包含免责声明或注意事项”）。如果可能，尽量展示而非描述——一个好例子胜过十句描述。

未来趋势

该领域发展迅速，2023年被视为关键的提示工程技术，到2025–2026年模型已不再那么必要。早期GPT-3.5用户需要复杂的提示结构才能获得可靠的JSON输出；如今Anthropic、OpenAI和Google的现代模型已能通过API原生支持结构化输出。思维链过去需要明确提示，而前沿模型现在能内部推理。趋势显而易见：模型正在将原本属于提示工程的技术吸收进训练中。但这并不意味着提示工程已过时——它只是提升了门槛。现在基础功能开箱即用，这意味着边缘情况、领域特定调优和系统级提示架构比以往任何时候都更重要。如果每个人都能免费获得80%的质量，那么竞争优势就在于最后的20%。

提示词工程

为什么重要

深度解析

技术叠加

有效模式

未来趋势

相关概念