Zubnet AI學習Wiki › 提示詞工程
使用AI

提示詞工程

精心設計輸入以從 AI 模型獲得更好輸出的實踐。從簡單技巧(具體明確、提供範例)到進階方法(思維鏈、少樣本提示、角色指定)都涵蓋在內。儘管名稱花俏,本質上是與統計系統清晰溝通。

為什麼重要

同一個模型可以因為你的提問方式不同而給出截然不同的結果。好的提示工程是提升 AI 輸出品質最低成本的方式 —— 不需要訓練、不需要微調,只是更好的溝通。

深度解析

提示工程常被貶為「只是好好問話」,但實務上它是任何使用 AI API 的人能掌握的最高槓桿技能。核心洞見是:語言模型對你如何框架請求極其敏感。一個含糊的提示(「寫一些處理資料的程式碼」)會啟動一個廣泛的回應分佈。一個具體的提示(「寫一個 Python 函數,讀取 CSV 檔案,篩選 'status' 欄位等於 'active' 的列,返回字典列表」)會將該分佈壓縮到更窄、更有用的範圍。一個懶惰的提示和一個精心設計的提示之間的輸出品質差異,往往大於兩代模型之間的差異。

疊加技巧

這些技巧可以層層疊加。最基礎的是清晰和具體 —— 告訴模型你確切想要什麼、什麼格式、有什麼限制。加上角色指定(「你是一位資深 PostgreSQL DBA,正在審查這個查詢的效能問題」),你就將模型的輸出分佈引導向專家級的回應。加入少樣本範例,你就定義了期望的確切格式和風格。加入思維鏈指令,你就提升了推理品質。指定輸出結構(「以 JSON 格式回覆,鍵為 summary、severity、recommendation」),你就能得到機器可解析的結果。每項技巧單獨來看都很簡單,但善於組合它們才是真正的技能所在。

真正的生產級提示工程看起來與演示截然不同。在生產系統中,你的提示是一個經過版本控制的精心模板,帶有變數,針對一套評估案例進行測試,並像程式碼一樣反覆迭代。Anthropic 和 OpenAI 等公司發布的提示工程指南讀起來更像軟體文件而非創意寫作建議。一個典型的生產提示(例如客服分類器)可能有 500 到 2,000 token 的指令、範例、邊緣情況處理和輸出格式規則。團隊會 A/B 測試提示變體、追蹤準確率和用戶滿意度等指標,並像維護程式碼庫一樣維護提示庫。

有效的模式

一些跨模型一致有效的實用模式:給模型一個「退路」,說「如果你不確定,就說不確定」(減少幻覺)。使用 XML 標籤或三重反引號等分隔符來清楚分隔指令和資料(防止提示注入)。將最重要的指令放在提示的開頭和結尾,而非中間(呼應注意力的運作方式)。明確說明你不想要什麼(「不要在回答中包含免責聲明或警語」)。盡可能用展示而非描述 —— 一個好的範例勝過十句描述。

未來方向

這個領域發展迅速,2023 年不可或缺的提示工程技巧到了 2025 至 2026 年的模型已不太必要。早期的 GPT-3.5 用戶需要精心設計的提示腳手架才能獲得可靠的 JSON 輸出;現在 Anthropic、OpenAI 和 Google 的模型都透過 API 原生支援結構化輸出。思維鏈曾經需要明確的提示;前沿模型現在已能內部進行推理。趨勢很清楚:模型正在將過去的提示工程技巧吸收到訓練中。但這並沒有讓提示工程過時 —— 而是提高了基準線。基礎功能現在開箱即用,這意味著邊緣情況、領域特定的調優以及系統級的提示架構比以往更加重要。當每個人都能免費獲得 80% 品質時,競爭優勢就在最後的 20%。

相關概念

← 所有術語
← 預訓練 量化 →
ESC