Zubnet AI学习Wiki › 提示词工程
使用AI

提示词工程

通过精心设计输入以获得更好的AI模型输出的实践。这包括从简单技巧(明确具体、提供示例)到高级方法(思维链、少量示例提示、角色分配)的范围。尽管名称听起来很花哨,但本质上是与统计系统进行清晰沟通的问题。

为什么重要

相同的模型根据提问方式不同可能会产生截然不同的结果。优秀的提示工程是提升AI输出质量最经济的方式——无需训练,无需微调,只需更有效的沟通。

深度解析

提示工程常被轻视为“只是礼貌地提问”,但实际上,对于使用AI API的任何人来说,它是杠杆效应最高的技能。核心洞察是语言模型对请求的表述方式极其敏感。模糊的提示(“写一些处理数据的代码”)会激活大量可能的响应分布。而具体的提示(“编写一个Python函数,读取CSV文件,筛选出'status'列等于'active'的行,并返回一个字典列表”)则将该分布压缩到更狭窄、更有用的范围内。一个懒散的提示与一个精心设计的提示在输出质量上的差异,往往比两个模型生成结果之间的差异更大。

技术叠加

这些技术可以叠加使用。在基础层,你需要清晰和具体——明确告诉模型你想要什么、以什么格式、什么约束条件。叠加角色分配(“你是一位资深的PostgreSQL数据库管理员,正在审查这个查询的性能问题”),你就能将模型的输出分布引导至专家级响应。添加少量示例,你就能定义期望的格式和风格。加入思维链指令,你就能提升推理质量。指定输出结构(“以包含summary、severity、recommendation键的JSON格式回复”),你就能获得可被机器解析的结果。每项技术本身都很简单,但将它们组合得当才是真正的技能所在。

真正的生产环境提示工程与演示完全不同。在一个生产系统中,你的提示是一个经过仔细版本控制的模板,带有变量,经过一套评估案例的测试,并像代码一样不断迭代。Anthropic和OpenAI等公司发布的提示工程指南,更像是软件文档而非创意写作建议。一个典型的生产环境提示,比如客户支持分类器,可能包含500–2000个token的指令、示例、边缘情况处理和输出格式规则。团队会进行A/B测试不同提示版本,跟踪准确率和用户满意度等指标,并像维护代码库一样维护提示库。

有效模式

一些在各模型中都持续有效的实用模式:通过“如果你不确定,请说明”给模型一个“退出”选项(减少幻觉)。使用XML标签或三重反引号等分隔符,明确区分指令和数据(防止提示注入)。将最重要的指令放在提示的开头和结尾,而非中间(与注意力机制的运作方式一致)。明确说明你不要什么(“不要在回复中包含免责声明或注意事项”)。如果可能,尽量展示而非描述——一个好例子胜过十句描述。

未来趋势

该领域发展迅速,2023年被视为关键的提示工程技术,到2025–2026年模型已不再那么必要。早期GPT-3.5用户需要复杂的提示结构才能获得可靠的JSON输出;如今Anthropic、OpenAI和Google的现代模型已能通过API原生支持结构化输出。思维链过去需要明确提示,而前沿模型现在能内部推理。趋势显而易见:模型正在将原本属于提示工程的技术吸收进训练中。但这并不意味着提示工程已过时——它只是提升了门槛。现在基础功能开箱即用,这意味着边缘情况、领域特定调优和系统级提示架构比以往任何时候都更重要。如果每个人都能免费获得80%的质量,那么竞争优势就在于最后的20%。

相关概念

← 所有术语
← 预训练 量化 →
ESC